Design and practice of container cloud platform based on Kubernetes
-
摘要: 为解决铁旅App既有后台架构应用研发不够灵活,平台运维成本不断提高的问题,以提高平台研发灵活性和自动化运维水平为目的,提出了基于Kubernetes容器云平台的总体架构设计,并结合容器云平台对研发流程进行了设计。经应用实践证明,该平台架构在保证平台运行稳定性的同时,可以有效提高研发效率并降低运维成本。
-
关键词:
- Kubernetes /
- Docker /
- 软件架构 /
- 自动化运维
Abstract: In order to solve the problems of inflexible application research and development of the existing background architecture of railway travel App, and the increasing cost of platform operation and maintenance, this article proposed the overall architecture design based on Kubernetes container cloud platform, and designed the research and development processin combination with the container cloud platform. The application practice shows that the platform architecture can effectively improve the research and development efficiency, reduce the operation and maintenance cost while ensuring the stability of the platform operation.-
Keywords:
- Kubernetes /
- Docker /
- software architecture /
- automatic operation and maintenance
-
城市轨道交通紧跟交通强国建设战略部署和智慧城市、智慧交通规划建设,迈入了超大规模、网络化发展的关键时期。其运维呈现出装备数量多、制式多样化、多阶段并存、配置不均衡的特点,面临运维难度大、人工经验局限、难以精准定位、管理效率低等问题,存在监测信息不全面、状态采集手段欠缺、维修模式有待提升等不足[1]。迫切需要由自动化、信息化向智能化转型,在体系化安全保障、故障智能诊断方面实现重点突破和深度融合。
如何利用信息化手段在支撑城市轨道交通企业可持续发展的同时,解决运营运维一体化管理痛点,满足全专业综合性运维需求,落实智能地铁和智能运维要求,已成为城市轨道交通领域的研究热点。文献[2]~文献[4]分别在铁路、城市轨道交通行业的设备维修管理、自主维修、人工计划修、委外维修等模式方面进行了阐述,文献[5]和文献[6]分别针对城市轨道交通车辆专业、供电专业的设备设施维修关键技术进行了研究。
本文在上述研究基础上,分析城市轨道交通综合运维现状及业务需求,利用云计算、大数据、物联网等新一代信息技术,开展城市轨道交通综合智能运维平台研究,实现全专业、综合性运维模式的优化提升。
1 综合智能运维需求分析
1.1 运维现状分析
目前,轨道交通行业的运维在管理模式体系化和管理手段信息化的助推下,朝着集中维修、综合维修的方向发展。
在铁路行业,德国、法国和日本等国家在“管、检、修”方面均有较为成熟和完备的设备维修管理模式[2];中国针对各铁路局集团公司高铁线路的实际运营维修特点,归纳出几种比较典型的固定设备维修管理模式[3]。在城市轨道交通行业,香港、北京、上海、广州、深圳等地的多家地铁公司,近年来在分专业自主维修、人工计划修、委外维修等方面积累了宝贵经验[4],同时大力推进设施设备智能化、信息化管理,加快运维维修专业人才培养速度。
1.2 多专业在线监测分析
城市轨道交通综合运维涉及车辆、工务、供电、通信、信号、机电等多个专业,包括调度、运用、安全、技术、质量、检修、整备、设备、验收、救援、燃料等方面[5-7]。综合智能运维主要基于关键设备设施的在线监测来实现重要数据的采集和分析,信息类型如图1所示。
1.3 维修模式体系分析
城市轨道交通设备设施运维逐步形成3种维修模式:计划修、故障修和状态修[8]。其中,计划修落实为修程、修制,以较高的维修成本遏制运营风险;故障修落实为临修和抢修,以较高的运营风险降低维修成本;状态修基于可靠性为中心的维修理论、实时状态检测和过程管控,平衡计划修、故障修的维修成本和风险成本,在优化修程、修制的同时,量化故障修指标。
城市轨道交通综合智能运维平台依托大数据分析,逐步形成“经验型计划修+感知型状态修+专家型故障修”的检修制度,全面构建基于状态感知及维修全过程的精准维护维修模式,实现面向线网运营场景需求的智能决策,整体提升设备运行质量可靠性和运维效率。
2 技术架构和平台功能
2.1 技术架构
在遵循统一规划、统一建设、统一标准的原则下,参考工业4.0标准[9]和国内外相关标准,构建城市轨道交通综合智能运维平台技术架构,如图2所示。
平台通过源端数据的感知与监测,打造数字基石,融入新技术、新应用,达到数据共享与业务协同,实现综合智能运维。
(1)数据源端层:利用多专业的综合监测单元,实现数据源的获取及各专业关键设备设施的在线监测,以数据驱动运维认知,实现人、机、物的数据支撑。同时通过网络的全方位覆盖,利用不同的传输方式,实现数据传输,促进数据的充分共享与互联互通。
(2)云基础平台层:云平台基础设施层(IaaS)主要实现云服务基础设备的搭建,完成计算、网络、存储资源分配建设;数据治理标准层(DaaS)通过整合大量结构化、半结构化和非结构化设备设施运维数据,提供数据实时获取、数据治理、数据模型、数据汇聚存储、数据挖掘、数据标准的大数据分析生态系统;业务中台层(PaaS)依托微服务架构,实现全生命周期资产管理、运维生产管理及智能运维体系构建;前端应用层(SaaS)为前端的各项运维功能提供支撑。
(3)智能应用层:通过打造实时监测、资产管理、智能运维、智能决策4个中心,实现综合智能运维资产、设备、生产及应急管理等功能及应用。
2.2 平台功能
2.2.1 实时监测
实时监测中心主要实现对线网系统、设备运行状态及故障信息的全貌、多维度、实时监测。基于工业控制、BIM立体图形化,结合大数据分析,实现设备全生命周期运行监测管理的可视化。
2.2.2 资产管理
资产管理中心主要实现对线网设备、物资、问题、资料等信息的统一和分类管理,应用移动和BIM技术实现设备履历、备品备件、物资、点巡检、健康评价、维修知识体系等资产全维度的数字化管理。
2.2.3 智能运维
智能运维中心通过智能化的诊断分析技术,制定运维计划和维修过程,实现设备故障智能定位、设备隐患预警、重大故障应急处置、多种运维模式应用的智能化。
2.2.4 智能决策
智能决策中心基于大数据和云计算技术,实现对运维故障、设备寿命、人员行为等历史数据的深度挖掘和智能分析,为后续运维决策及模式提升提供数据支持,实现数据管理及决策分析的智能化。
3 关键技术
3.1 基于物联网的设备状态实时感知技术
依托射频识别(RFID,Radio Frequency Identification)、二维码、智能芯片等智能识别技术,结合各类设备状态传感器、在线监测装置、移动终端、巡检机器人等感知手段[10],构建智能运维感知物联网,有力支撑全面设备状态管控和资源实时配置。
3.2 基于大数据的多专业智能运维预测构建技术
根据轨道交通不同专业的运维数据进行预测模型构建,提供多种智能运维分析预测技术,按照不同的故障类型,开发出相应的运维控制程序,对设备故障进行智能处理。
3.3 基于云平台的微服务融合技术
平台涉及车辆、供电、通信、信号、工务、机电多个专业,覆盖多条线路及网络管理规模。在平台建设过程中,结合各专业、各线路不同的业务特点,采用SpringCloud技术架构来进行微服务能力建设。通过开放式微服务体系可以将地铁不同专业、不同线路、不同用户封闭的较大功能模块,细分为多个开放的小功能服务模块,从而便于上层应用和不同专业间进行访问调用,实现资源的最大限度利用,完成自上而下和自下而上的开发融合[8]。
4 结束语
本文设计并实现的城市轨道交通综合智能运维平台,贯穿设施设备全寿命周期管理理念,以设备设施在线监测及现场生产管理为核心,形成实时监测、资产管理、智能运维、智能决策全过程的信息化管控。实现轨道交通车辆、工务、供电、通信信号专业与车站设施设备的实时状态感知、故障预测与智能运维,提高运维部门安全风险管理水平,优化生产组织和业务流程,降低能耗和生产成本。
-
[1] 刘卓华,李聚宝,王丽华,等. 关于12306网站旅客服务的研究与设计[J]. 铁路计算机应用, 2016, 25(10):38-40. [2] 丁海斌,崔隽,陆凯. 基于Docker的DevOps系统设计与实现[J]. 指挥信息系统与技术, 2017(3):87-92. [3] 宗序梅,任彦辉. 基于Kubernetes的PaaS平台研究与实践[J]. 江苏通信, 2018(2):76-79. [4] 张文林. 持续交付及其在大型项目中的应用[J]. 软件导刊, 2017, 16(10):159-161. [5] 盛乐标,周庆林,游伟倩,等. Kubernetes高可用集群的部署实践[J]. 电脑知识与技术, 2018, 14(26):46-49. [6] 陈卫平. 高可靠、可用数据库系统平台的建立[J]. 铁路计算机应用, 2005, 14(z1):239-242. [7] 王骏翔,郭磊. 基于Kubernetes和Docker技术的企业级容器云平台解决方案[J]. 上海船舶运输科学研究所学报, 2018, 41(3):54-60. [8] 仇臣. Docker容器的性能监控和日志服务的设计与实现[D]. 杭州:浙江大学, 2016. [9] 樊炼,廖振松. 一种云计算时代的DevOps自动化运维平台[J]. 电信工程技术与标准化, 2018, 31(11):68-71. [10] 董昕,郭勇,王杰. 基于DevOps能力模型的持续集成方法[J]. 计算机工程与设计, 2018, 39(7):1930-1937. -
期刊类型引用(23)
1. 韩德志,韩晓艺,华福才,杨良印,邵昕. 数字孪生与多系统融合的城轨综合管控平台研究与实施. 都市快轨交通. 2025(01): 112-119 . 百度学术
2. 钟建峰,韩天,宣秀彬,蔡宇晶,郭顺利. 基于gRPC的城市轨道交通线网运营指挥平台分布式图纸数据同步更新方法. 铁路计算机应用. 2024(07): 74-79 . 本站查看
3. 王贤瑞,光志瑞,陈冉,解柏川,王淞艺. 城市轨道交通智能维修层级及技术研究. 设备管理与维修. 2024(20): 60-64 . 百度学术
4. 刘继平. 轨道交通工务维修管理数字化转型研究. 现代城市轨道交通. 2024(11): 14-20 . 百度学术
5. 钟建峰,孟宇坤,王石生,韩天,蔡宇晶,宣秀彬. 基于gRPC分布式数据通信的地铁线网指挥中心平台设计与实现. 都市快轨交通. 2023(02): 190-197 . 百度学术
6. 杨帆,丁明辉,邓瑾,刘畅,李明. 地铁车辆信息互联共享方案研究. 智慧轨道交通. 2023(02): 26-32 . 百度学术
7. 郭嘉曦. “精益五星”检修现场管理. 中国质量. 2023(03): 113-117 . 百度学术
8. 陶然. 城市轨道交通通信系统智慧运维平台设计. 交通科技与管理. 2023(18): 16-18 . 百度学术
9. 王婷. 城市轨道交通供电智能运维系统研究. 铁道建筑技术. 2023(09): 74-77+188 . 百度学术
10. 孔凡超,吕方林,薛学晓,李华栋. 城市轨道交通车联网综合在途监测系统的研究与应用. 智慧轨道交通. 2023(06): 75-82 . 百度学术
11. 蒋永兵,徐建,王鹏聪. 基于多源数据融合的轨道交通供电智能运维架构研究. 电气化铁道. 2023(S2): 9-12 . 百度学术
12. 党晓勇. 基于云计算的轨道交通机电智能运维平台设计研究. 现代信息科技. 2022(02): 6-8 . 百度学术
13. 李海培. 城市轨道交通云计算技术研究及应用. 自动化与仪表. 2022(05): 99-103 . 百度学术
14. 蔡昌俊,朱小山,邱启盛,王艺达,白丽,张凌云. 广州城际铁路智慧运管系统架构研究与设计. 现代城市轨道交通. 2022(06): 12-16 . 百度学术
15. 鲍飞达,王颖. 浅谈智能化城轨供电运维平台应用层的功能要求. 内蒙古科技与经济. 2022(08): 120+123 . 百度学术
16. 徐余明,黎家靖,张宁,石先明,刘利平,胡祖翰. 基于云-边-端架构的城市轨道交通智能运维系统. 都市快轨交通. 2022(06): 145-150+157 . 百度学术
17. 郑儆醒. 城市轨道交通信号专业智能运维的应用. 电子技术与软件工程. 2021(15): 175-178 . 百度学术
18. 周阳. 城市轨道交通智慧车站设计研究. 江西建材. 2021(09): 150-151 . 百度学术
19. 宣秀彬,高凡,张铭,付思,蔡宇晶. 城市轨道交通智慧出行App的设计与实现. 铁路计算机应用. 2021(10): 69-72 . 本站查看
20. 李璐,王爱丽,王子腾,窦元辰. 基于多源数据融合的城市轨道交通人员综合监测及运营管理系统研究. 铁路计算机应用. 2021(10): 47-53 . 本站查看
21. 张玉福,孔垂云,刘宇,岳阳,王赛. 货运票据电子化部署架构设计与运维保障. 中国铁路. 2021(11): 8-13 . 百度学术
22. 王瑞锋. 基于智能检测监测与大数据技术的城市轨道交通智能运维管理. 现代城市轨道交通. 2021(11): 85-89 . 百度学术
23. 王磊,陆川,蒲丹丹,林意为. 基于改进卷积神经网络的地铁客流量预测算法设计. 现代电子技术. 2021(24): 87-91 . 百度学术
其他类型引用(3)
计量
- 文章访问数: 288
- HTML全文浏览量: 30
- PDF下载量: 74
- 被引次数: 26