Intelligent operation and maintenance platform for urban rail transit passenger information system
-
摘要:
针对当前城市轨道交通(简称:城轨)乘客信息系统(PIS,Passenger Information System)运营维护(简称:运维)方式智能化水平低、对人工依赖性强、人工成本高、故障发现慢及处理效率低等问题,设计并实现了城轨PIS智能运维平台。基于特征对比、日志分析、决策树等技术,通过主动检测、故障智能检测与诊断、处置决策辅助、远程运维等方式,面向运维人员提供故障告警提示、故障信息展示、故障诊断分析、运维决策建议、远程运维操作等功能,实现了PIS运行过程中故障发现−诊断−处置全流程的快速响应和功能扩展,提高了城轨PIS的运维效率和智能化水平。
Abstract:In response to the low level of intelligence, strong dependence on manual labor, high labor costs, slow fault detection, and low processing efficiency in the operation and maintenance of passenger information systems in current urban rail transit, this paper designed and implemented an urban rail transit PIS intelligent operation and maintenance platform. Based on technologies such as feature comparison, log analysis, and decision tree, through active detection, intelligent fault detection and diagnosis, disposal decision assistance, remote operation and maintenance, etc., the paper provided functions such as fault alarm prompts, fault information display, fault diagnosis analysis, operation and maintenance decision suggestions, and remote operation and maintenance for operation and maintenance personnel, implemented the rapid response and functional expansion of the entire process of fault discovery diagnosis disposal in PIS operation, and improved the operational and maintenance efficiency and intelligence level of urban rail transit PIS.
-
乘客信息系统(PIS,Passenger Information System)主要用于在轨道交通运营过程中向乘客提供实时信息服务,同时,在紧急情况发生时迅速直观地发布疏散及防灾信息等,保障城市轨道交通(简称:城轨)安全运行[1]。《中国城市轨道交通智慧城轨发展纲要》[2]提出,将车辆、能源、通信、信号等智能运营维护(简称:运维)系统在全行业推广应用作为其安全建设目标。PIS作为城轨的核心业务系统,其智能运维是智慧城轨发展的必要环节。
目前,PIS故障多由车站巡检人员人工检查发现,再由运维人员前往现场,分析故障原因并进行处理。这种方式人工成本高、不利于及时发现和解决问题,且可能存在非法入侵设备的风险和危险信息传播的隐患[3]。对PIS进行智能运维,能够有力保障乘客信息服务的稳定和安全,降低重大故障发生的可能性,提高运营安全和乘客出行质量[4]。
随着人工智能、大数据、知识图谱等技术的发展,国内外研究人员结合先进技术与城轨业务应用,进行了故障预测与健康管理技术相关研究。ZhangG,L.等人[5]通过大数据平台实现信号、列车、无线、电源、自动售检票等接入系统的异常自动检测;蔡宇晶等人[6]基于数字孪生技术实现设备实时感知与主动维修;田兴丽等人[7]基于机理与机器学习智能诊断模型实现城轨车辆制动系统的智能运维;高云超[8]基于系统外部接口日志分析实现城轨列车自动监控(ATS, Automatic Train Supervision)系统的故障原因分析;何家明[9]设计实现了地铁ATS系统故障分析和深度巡检功能的智能化分析平台。
基于上述研究,本文结合PIS应用现状,针对PIS架构特点、业务逻辑及实际运维难点,设计并实现了城轨PIS智能运维平台。
1 平台设计
1.1 平台架构
城轨PIS智能运维平台架构如图1所示。
(1)数据采集层:实时采集PIS软/硬件运行相关数据,包括设备运行状态、设备播放画面、PIS运行日志及PIS播放计划等。其中,设备运行状态数据包括设备CPU占用率、磁盘占用率等可能影响设备运行状态的关键参数数据;设备播放画面为当前设备正在播放的画面图像数据;PIS运行日志为某段时间内PIS运行的日志文件数据;PIS播放计划为PIS面向乘客以终端为媒介按计划进行播放的相关乘客服务信息数据。
(2)网络传输层:为数据传输及设备管控建立可靠的网络传输通道。通过建立数据传输接口实现采集数据的安全稳定传输,并根据数据特征制定传输定制协议,通过建立网络链路实现设备的互联互通和远程运维。
(3)业务支持层:基于特征对比算法、决策树算法等核心算法及日志分析、远程运维等技术,实现基于特征对比的故障检测、基于日志分析的故障智能诊断分析、基于决策树的运维决策生成及PIS远程运维等功能,为平台应用层提供业务支撑。
(4)平台应用层:面向PIS运维人员,提供实时监测、故障告警、故障诊断、运维决策、远程运维等业务支持,向运维人员实时展示PIS相关应用终端及PIS服务器等软/硬件的监测信息,在检测到PIS软/硬件故障、发生告警时进行故障告警,并在故障发生时依据相关信息诊断故障原因和生成运维策略,提供故障诊断及运维决策参考,同时提供远程运维操作支持。
1.2 业务流程
根据城轨PIS智能运维需求进行业务流程设计,如图2所示,主要包括主动检测、故障处置、远程运维等3个核心步骤。
(1)主动检测:对PIS相关设备进行集中监测,实时采集设备运行状态关键指标及播放终端画面图像数据,根据采样数据进行故障检测。
(2)故障处置:当检测到有故障发生时,进行故障内容的识别,采集日志等相关故障信息,依据已有运维经验生成的运维决策树进一步诊断故障发生的原因并生成运维决策方案;进行故障告警,向运维人员发送包含设备信息、PIS日志、终端画面等在内的告警信息,同时,向其推荐生成的运维决策方案及故障诊断信息,并提供与运维决策方案对应的自动运维脚本,辅助运维人员进行故障处置。
(3)远程运维:由运维人员进行远程运维操作,并根据运维人员反馈的故障诊断及实际的运维方案,更新运维决策树。
2 平台功能
城轨PIS智能运维平台面向PIS运维人员,主要功能如下。
2.1 信息展示
负责展示当前PIS所含软/硬件运行信息,包括PIS软件运行进程及其运行状态、硬件设备CPU占用率、磁盘占用率等关键信息,信息以主动采集方式获取,为运维人员提供当前PIS各类信息的展示界面。
2.2 实时故障告警
负责在检测到PIS运行过程中的软/硬件故障时实时向运维人员提示故障告警,并同步展示故障相关的设备运行状态、进程运行状态、设备播放画面、日志文件等信息,便于运维人员快速了解故障情况,提高运维效率。
2.3 处置决策建议
负责在故障发生时利用获取的监测信息对故障情况进行智能化分析,诊断故障成因,并依据已有运维经验生成运维决策,为运维人员进行故障分析和处理提供可能的故障原因及运维决策辅助参考。
2.4 远程运维操作
负责为运维人员提供远程执行运维操作途径,能够远程对PIS故障进行处理,解决故障发生时运维人员难以立即对故障进行处理所导致的运维效率低的问题;支持运维人员删除无效的运维决策方案,同时记录运维操作、更新决策树模型,以提高决策树模型质量和适用性。
3 关键技术
3.1 基于特征对比的故障检测技术
为高效快捷地检测PIS运行状态,采用基于特征对比的方式对PIS进行故障检测,分别对PIS设备的运行状态和画面图像实时采样,并对运行状态关键特征和播放画面图像特征进行对比分析,检测有无故障发生。
(1)对PIS设备的设备运行状态信息进行实时采样,获取设备磁盘占用率、CPU状态、网络连接等关键指标采样值,判断采集的设备运行状态关键指标数据是否处于预设正常运行区间中,得到设备硬件方面故障检测结果。
(2)对PIS设备的播放画面图像数据进行实时采样,并通过数据接口获取PIS设备的播放计划,对比实际播放画面图像特征与计划播放画面特征是否一致。
为提高检测效率,采用图像数据的灰度特征进行对比,判断实际图像与计划图像的灰度直方图数据是否一致,当实际与计划不符时,即可判断PIS出现软/硬件运行故障。利用灰度直方图进行故障识别的示例如图3所示,分别列举了计划播放画面、正常状态下播放画面与出现故障时播放画面的特征数据,从图中可以看出,当故障发生时特征数据也出现明显异常。
3.2 基于日志分析的故障诊断技术
为提高运维人员运维效率、为其提供故障智能分析参考,检测发现PIS软件运行故障后,还需要进一步对故障设备、故障进程、故障原因等进行诊断。采用基于日志分析的方式进行故障诊断,利用日志数据对PIS运行过程中的信息记录进行深入挖掘与分析,实现PIS故障的排查与诊断。监测PIS进程运行情况;当进程出现非正常运行状态时,进一步对该进程运行日志进行检测分析;提取日志中报错内容,并根据定制协议解析,生成故障诊断。
3.3 基于决策树的故障处置技术
基于已有运维历史数据及运维人员工作经验,构建面向PIS运维的运维决策树,按“故障内容检测−故障原因−运维方案”几个层次对决策树模型进行训练,得到预先构建的运维决策树模型。图4为运维决策树模型示意图,图中,实线白色框为故障内容检测信息,实线灰色框为故障原因诊断信息,虚线框为运维方案建议信息。
为保证运维决策树模型的全面和完整,在初始化时,模型结果节点中的运维方案保留了所有历史运维方案案例,并按对应故障原因下运维方案被采用历史次数计算各方案的权重,在向运维人员进行运维决策推荐时按权重由高到低对各类方案进行排列,权重计算公式为
$$ {S}_{i}=\frac{{T}_{i}}{\sum _{m=1}^{M}{T}_{m}} $$ 式中,
$ {S}_{i} $ 为第i类运维方案权重;$ {T}_{i} $ 为第i类运维方案的历史被采用次数;M为对应故障原因下运维方案案例总数;$ {T}_{m} $ 为第m类运维方案的历史被采用次数。3.4 远程运维技术
为提高运维效率,减少路途中损耗的时间,向运维人员提供远程运维方式,通过对PIS终端设备及服务器等进行统一接入和集中管控,为运维人员远程操作提供基础。
根据运维人员远程操作内容,对用于运维决策生成的决策树模型进行实时同步更新,同时,为提高运维人员操作效率、避免过多的无效运维方案推荐,支持运维人员对运维决策树模型结果节点中的运维决策进行删减,去除无效的运维决策方案。
4 平台应用
目前,城轨PIS智能运维平台已在苏州地铁6号线、11号应用,负责为其提供设备状态、软件运行进程、实时播放画面等PIS信息展示、发送实时故障告警信息、生成处置决策建议并提供远程运维操作途径。智能运维平台中,信息展示功能模块的网管中心服务器设备状态监控界面如图5所示。
5 结束语
本文以保障城轨PIS高效、稳定、安全运行,以及在其发生故障时迅速发现问题并及时解决问题为目标,基于日志分析、决策树算法等智能化技术,设计并实现了从监测到运维全流程的城轨PIS智能运维平台,为PIS的运行故障提供了高效发现及处置手段。与传统方式相比,该平台极大地提高了PIS运维效率,未来将进一步探索智能化故障诊断分析与处置技术,提升运维决策的安全性和可靠性。
-
[1] 赵伟慧,孙同庆,汪晓臣,等. 城市轨道交通乘客服务信息发布安全保障方案研究[J]. 铁道运输与经济,2022,44(4):106-111. [2] 中国城市轨道交通协会. 中国城市轨道交通智慧城轨发展纲要[J]. 城市轨道交通,2020(4):8-23. [3] 何鹏飞. 轨道交通智能运维建设研究[C]//2022年智慧城市与轨道交通峰会论文集,2022-01-01,北京. 北京:中国城市出版社,2022. 213-220. [4] 申樟虹,乔志忠,刘潇洋,等. 城市轨道交通车站机电设备智能运维及能源管理系统[J]. 城市轨道交通研究,2022(S2):131-135. [5] Zhang G L, Lin J, Zhang Y, et al. Big data based intelligent operation and maintenance platform[C]//2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE), 11-13 September, 2020, Beijing, China. New York, USA: IEEE, 2020. 249-253.
[6] 蔡宇晶,高 凡,孟宇坤,等. 城市轨道交通设备智能运维系统设计及关键技术研究[J]. 铁路计算机应用,2023,32(7):79-83. DOI: 10.3969/j.issn.1005-8451.2023.07.15 [7] 田兴丽,孙环阳,张红光,等. 城市轨道交通车辆制动系统的智能诊断与预警系统[J]. 城市轨道交通研究,2023,26(11):94-98,103. [8] 高云超. 城市轨道交通ATS系统外部接口日志分析[J]. 铁路通信信号工程技术,2021,18(1):76-79. DOI: 10.3969/j.issn.1673-4440.2021.01.015 [9] 何家明. 城市轨道交通运维需求智能化分析平台的研究及应用[J]. 城市轨道交通,2022(6):39-41. -
期刊类型引用(2)
1. 吕超. 城市轨道交通基础设施智能运维平台构建与应用. 运输经理世界. 2025(08): 1-3 . 百度学术
2. 陈静莎,何建军,张树军. 基于GO法的地铁自动售票系统运行可靠性分析. 无线互联科技. 2024(23): 122-125 . 百度学术
其他类型引用(0)