Development and application of online status monitoring and intelligent analysis system for onboard equipment of CTCS3-300H
-
摘要:
针对CTCS3-300H型列控车载设备(简称:列控车载设备)各单元运行日志数据分散存储、数据转储下载接口多、数据分析工作繁琐耗时的问题,根据列控车载设备结构特点,设计了列控车载设备状态在线监测及智能分析系统。该系统统一了列控车载设备各单元的日志数据采集与传输接口,借助既有的车地无线传输通道,设计了灵活、务实的车地数据传输方案,实现了用于列控车载设备状态在线监测的事件通告报文的实时传输,提供故障日志自动下载、手动按需下载两种日志数据无线下载方式,在满足列控车载设备状态在线监测和故障分析需要的前提下,最大限度地减少车地数据传输量。通过有效利用列控车载设备日志数据进行智能分析,能够快速、准确定位故障原因,实现故障自动报警并给出处置建议,提高了列控车载设备故障应急处置和维护效率,为动车组安全运行提供强有力的技术保障。
Abstract:To deal with the issues of scattered storage of operation log data in each unit, multiple data dump and download interfaces, and tedious and time-consuming data analysis work of the on-board equipment of CTCS3-300H train control system, the online status monitoring and intelligent analysis system for CTCS3-300H onboard equipment is designed based on the structural characteristics of the equipment. The system unifies the collection and transmission interfaces of log data for each unit of the train control on-board equipment. By use of existing train-ground wireless transmission channel, a flexible and practical train-ground data transmission scheme is designed to achieve real-time transmission of event notification message for online monitoring of train control on-board equipment status as well as two wireless download methods for fault logs: automatic download and manual on-demand download. While meeting the needs of online monitoring and fault analysis of train control on-board equipment status, the transmission volume of train ground data is minimized. By effectively utilizing the log data of train control on-board equipment for intelligent analysis, it is possible to quickly and accurately locate the cause of faults, achieve automatic fault alarms and provide fault disposal suggestions, improve the efficiency of fault emergency response and maintenance of train control on-board equipment, and provide strong technical support for the safe operation of high-speed trains.
-
CTCS3-300H型列控车载设备(简称:列控车载设备)是保障CTCS3级动车组安全运行的关键设备之一,已在全铁路广泛应用。随着我国高速铁路的快速发展,投入运营的列控车载设备数量不断增加,设备运用和维护工作量随之增长,对数据分析的准确性和故障处理的及时性提出了更高要求[1-3]。
CTCS3-300H型列控车载设备采用2乘2取2的双系冗余结构设计,主要由安全计算机(VC)、无线传输单元(RTM)、车载电台单元(GSM-R)、地面轨道电路接收单元(TCR)、地面应答器接收单元(BTM)、继电器逻辑单元(RLU)和人机界面(DMI)等组成[4-5]。由于采用双系多通道配置,该设备的运行日志数据分散存储在各单元的记录模块中,数据转储下载接口多,操作繁琐耗时。此外,维护人员要使用多套数据分析软件,且这些软件的数据分析工作交叉重叠,分析结果不能有效关联,影响了数据分析应用成效。
为此,本文根据CTCS3-300H型列控车载设备的结构特点,开发了适用于CTCS3-300H型列控车载设备的在线监测与智能分析系统,集中采集列控车载设备各单元的日志数据,借助既有的车地无线传输通道,将列控车载设备当前的主要状态数据实时传输到地面,能在列控车载设备故障发生时自动下载相关日志数据,使电务部门能够在线监测所有配属动车组列控车载设备的工作状态,充分利用日志数据分析故障原因,并给出处置方案,指导维护人员快速做出应急响应。
1 系统构成与逻辑架构
1.1 系统构成
CTCS3-300H型列控车载设备在线监测与智能分析系统(简称:在线监测与智能分析系统)主要由车载数据下载单元、地面中心服务器和智能分析终端构成,如图1所示。
1.1.1 车载数据下载单元
安装在列控车载设备机柜中预留空位上,主要包括数据交换模块、数据存储模块和数据维护模块;利用列控设备动态监测系统(DMS,Dynamic Monitoring System)的车地无线传输通道,与地面中心服务器进行信息交互。该单元具备故障隔离机制,当其发生故障时,不会影响列控车载设备和DMS车载设备的正常运行。
数据交换模块分别通过RSR232接口和以太网接口,实时接收列控车载设备双系的VC、RTM、BTM和GSM-R等各单元的日志数据,转发给数据存储模块。数据交换模块从最新的日志数据抽取列控车载设备的运行状态信息,例如运行模式、运行等级、故障代码、故障维修信息、故障文本信息等,生成事件通告报文,实时传输至地面中心服务器;同时,响应地面中心服务器发送的故障日志数据下载请求,将列控车载设备故障相关的日志数据进行压缩和加密处理后,传输给地面中心服务器。
数据存储模块接收数据交换模块转发的日志数据,将不同系别、不同单元的日志数据按时间分类存储在本地存储中,可支持长达30天的覆盖存储。
维护模块提供了日志数据转储接口(USB接口)和车载数据下载单元软件升级接口,用户可使用专用转储设备和维护用便携机完成数据转储和软件升级;此外,还提供监控车载数据下载单元运行状态指示灯,用户可通过观察指示灯确认车载数据下载单元的工作状态。
1.1.2 地面中心服务器
安装在铁路局集团公司信息机房内,通过DMS提供的车地无线传输通道,与车载数据下载单元进行信息交互,接收铁路局集团公司配属的所有动车组车载数据下载单元传输的列控车载设备运行数据(主要包括事件通告报文和日志文件);响应智能分析终端发出的故障日志下载请求,自动从车载数据下载单元下载经过压缩和加密处理的故障日志,将其解压、还原;装载转储的日志数据;集中分类存储所有列控车载设备日志,供智能分析终端访问使用;存储智能分析终端的分析结果记录及诊断报告,供智能分析终端查询。
1.1.3 智能分析终端
通常安装在电务段车间、分析工区及检修工区,接入路局办公网,并为每一套智能分析终端设备分配了负责监控管理的动车组列控车载设备。智能分析终端设备接收所管理动车组的车载数据下载单元发送的事件通告报文,在线监测这些动车组列控车载设备的运行状态;通过分析事件通告信息进行故障预判,预判出潜在的故障后,会自动向地面中心服务器提出故障日志下载申请,由地面中心服务器完成故障日志下载;利用日志数据进行智能分析,判断故障原因和预测列控车载设备健康状态,生成维修指导建议;用户可根据需要,手动选择下载所需的车载日志数据。此外,该终端为系统管理员提供系统维护操作界面。
在线监测与智能分析系统借助DMS提供的车地无线传输通道,实现车载数据下载单元与地面中心服务器的信息交互,保证了数据传输的安全性和可靠性,并通过利用既有成熟的车地无线传输平台达到降本增效目的[6]。
1.2 逻辑架构
从数据流程的角度,在线监测与智能分析系统逻辑架构划分为4个层次:数据采集层、数据管理层、数据分析层和业务应用层,如图2所示。
(1)数据采集层:车载数据下载单元的数据交换模块通过RS232接口,从列控车载设备的VC、RTM和GSM-R电台实时采集日志数据,通过以太网接口从BTM实时采集日志数据;在将采集到的日志数据存储在车载数据下载单元内部存储模块的同时,从最新的日志数据中抽取事件通告信息并实时传输至地面中心服务器,用于在线监测列控车载设备运行状态和故障预判;当智能分析终端预判列控车载设备故障时,自动下载故障相关的日志数据;按需手动下载日志数据,完成车载日志数据转储。
(2)数据管理层:集中存储数据采集层获取的列控车载设备事件通告信息、下载和转储的各类日志数据、智能分析终端设备生成的分析记录,并为数据分析层和业务应用层提供数据访问服务。
(3)数据分析层:通过分析事件通告信息进行故障预判;利用多种数据分析模型和算法,对日志数据进行智能分析,准确判断列控车载设备故障原因,预测列控车载设备健康状态,并给出维修处理建议。
(4)业务应用层:面向系统用户,提供列控车载设备状态在线监测界面,实现故障报警信息自动弹窗推送,提供系统运用管理和维护支持。
2 主要功能
2.1 数据采集与传输
(1)列控车载日志实时采集:车载数据下载单元通过RS232接口和以太网接口,并行采集列控车载设备各单元的运行日志数据,将采集到的日志数据按时间、车号和车次号等分类存储在数据存储模块内。
(2)事件通告信息生成与传输:车载数据下载单元从最新日志数据抽取列控车载设备的运行状态信息,生成事件通告报文;利用DMS车地无线传输平台提供的报文传输接口,完成事件通告报文实时传输。
(3)日志数据压缩及加密:车载设备下载单元对传输的日志数据进行压缩和加密处理,确保数据安全性和完整性的同时,降低数据传输量,减少无线传输带宽的占用。
(4)日志数据传输:利用DMS车地无线传输平台提供的文件传输接口,将经过压缩及加密的日志数据文件传输至地面中心服务器。
2.2 日志数据下载、转储与存储管理
(1)故障日志自动下载:当预判列控车载设备出现故障时,智能分析终端立即自动发出故障日志下载申请,地面中心服务器与车载数据下载单元进行通信,与将故障时间段的相关日志数据自动下载至地面中心服务器。
(2)日志手动下载:用户可以根据需要,利用智能分析终端选择需要下载的日志数据,启动手动下载功能,由地面中心服务器与车载数据下载单元进行通信,将指定的日志数据自动下载至地面中心服务器。
(3)车载日志数据转储:用户通过转储文件生成工具软件,将需要转储的日志数据类型和日期段写入引导文件,并将引导文件拷贝至转储U盘;将带有引导文件的转储U盘插入车载数据下载单元的日志数据转储接口(USB接口)时,可自动将保存在数据存储模块内的指定日志数据自动拷贝到转储U盘中。
(4)日志数据分类存储:地面中心服务器按不同系别、不同单元及时间段,将解密和恢复后下载的车载日志数据及转储的日志文件分类集中存储,与车载数据下载单元中日志文件的存储方式完全相同,以便于管理多种方式下载和转储的日志数据。
2.3 监测与报警
(1)列控车载设备运行监测:根据车载数据下载单元实时发送的事件通告信息,在图形化界面上动态显示和刷新所监控的列控车载设备的运行状态。
(2)列控车载设备报警:当通过智能分析发现列控车载设备出现故障后,智能分析终端监控主窗口自动弹出故障报警简报及详细信息窗,提醒电务人员及时安排应急处置。
2.4 智能分析
(1)列控车载设备故障预判:对车载数据下载单元实时发送的事件通告报文进行分析处理,粗略判断列控车载设备是否出现潜在故障(即异常运行状态)。
(2)列控车载设备故障智能分析:利用智能分析算法处理故障相关日志数据,从中提取关键信息,并结合故障案例库、故障代码及故障文本解析、车载处理逻辑功能等,对列控车载设备故障原因做出初步判断,提供分析结论及处置建议,并自动生成分析报告。
(3)列控车载设备健康预测:采用数据挖掘方法,对车载设备运行数据进行挖掘分析,统计车载设备在不同环境线路、不同运行速度下的工作状态、工作时间长等;基于历史数据,对车载设备板卡性能参数变化趋势进行预测,预测列控车载设备健康趋势。
2.5 系统维护
提供用户管理、日志查看与分析、运用管理、车载软件升级功能,方便系统运用和维护管理。
(1)用户管理:系统管理员可增删系统用户,定义角色,指定用户的操作权限。
(2)日志查看与分析:系统管理员可查看系统运行日志,了解系统运行情况,并依据性能参数统计(如系统响应时间、并发用户数、总用户访问数等),进行系统调优。
(3)运用管理:设置各智能分析终端负责监控车载日志数据车组列控车载设备。
(4)车载软件升级:车载设备维护专职使用维护用便携机,通过车载数据下载单元提供软件升级接口完成车载软件升级更新。
3 车地数据传输及数据分析处理流程
3.1 车地无线数据传输
在线监测与智能分析系统利用DMS车地传输平台传输的数据主要有2类:事件通告信息和日志数据。
(1)事件通告信息:由车载数据下载单元实时采集列控车载设备各单元日志数据后,从中抽取列控车载设备主要运行状态数据生成事件通告报文,这类信息数据量较少,通过DMS车地无线传输平台提供的报文传输接口,实时传输至地面中心服务器,用于实时监控列控车载设备运行状态。
(2)日志数据:车载数据下载单元存储的日志数据量较大,需要经过压缩和加密后再进行传输,地面中心服务器接收后进行解压和还原。日志数据传输时机分为两种情况:①当地面智能分析终端预判出某列动车组列控车载设备发生故障时,立即发出故障日志下载申请,车载数据下载单元将故障相关的日志数据传输至地面中心服务器;②用户根据需要,指定需要下载的日志类型及时间段,手工启动数据下载功能,车载数据下载单元将指定的日志数据传输至地面中心服务器。
将车载数据划分为事件通告信息和日志数据进行传输,能够在同时实现动车组列控车载设备运行状态在线监控、满足故障分析需要的前提下,避免因大量车地数据传输占用既有DMS无线传输通道而影响其正常运行。
3.2 车载日志数据传输与分析流程
由于列控车载日志数据量巨大,且数据分析涉及到多个组成单元。为减少不必要的车地数据传输,智能分析终端启动后,会根据数据分析的步骤,按需分多次向地面中心服务器请求下载相关单元的日志数据,即将车载日志数据的传输与分析过程划分为几个阶段分步执行,如图3所示。
(1)故障预判:智能分析终端对实时接收的事件通告报文进行分析,粗略判断是否存在潜在故障(异常)。
(2)VC日志传输:当智能分析终端检测到存在潜在故障(异常)时,确定需要下载的VC日志数据范围,自动向地面中心服务器发送VC日志数据传输请求,系统自动下载VC日志数据。
(3)其他单元日志传输:智能分析终端对VC日志数据进行初步分析,判断是否需要进一步下载BTM数据、RTM数据、GSM-R电台日志数据;若判断需要进一步结合其他单元日志数据进行分析,则向地面中心服务器发送相应的日志数据下载请求。
(4)智能分析:当所需的日志数据下载完成后,智能分析终端通过提取各单元日志数据中的关键信息,依据智能分析算法,检索专家库,分析故障原因,自动生成故障分析报告,给出处置建议。
在车载日志数据传输与分析的过程中,智能分析终端会在自身的日志中记录每一个数据分析步骤和每一次车载日志数据下载申请的开始执行时间和结束时间。当出现智能分析终端突然宕机的情况时,智能分析终端重启后,会根据自身的日志记录,判断最近执行步骤是否成功完成,确保被中断的车载日志数据传输与分析过程从中断点有效恢复。
4 关键技术
4.1 事件通告信息抽取
为了通过实时传输的事件通告报文来实现列控车载设备在线监测功能,车载数据下载单元需从采集到的列控车载设备各单元的最新运行日志数据中抽取尽量简洁、且最能表征列控车载运行状态的数据项作为事件通告报文的信息内容。
列控车载设备VC单元的日志数据信息最为完整详细,为此从VC单元最新的日志数据中提取关键信息作为事件通告报文的内容。当车载数据下载单元实时采集到VC单元日志数据时,将一段时间窗口内接收到数据与故障代码库进行匹配筛选,抽取车次号、列车速度、公里标、时间和故障代码等简要信息生成事件通告报文。
4.2 列控车载设备故障预判
列控车载设备的功能模块较多、故障模式复杂,各单元模块之间存在关联关系,可利用基于经验积累形成的故障知识库,快速地大致判断列控车载设备故障类型[7]。
从列控车载设备已发生的故障数据中提取特征信息,如制动等级、故障代码、故障文本等关键字,结合列控车载设备逻辑功能进行归纳分类形成故障类别,作为故障预判的参考。智能分析终端在进行列控车载设备故障预判时,将事件通告信息与故障知识库的关键语句信息进行匹配后,快速对列控车载设备潜在的故障做出预判,并据此发起相关日志数据下载请求。
4.3 智能分析算法
列控车载设备的功能模块较多、故障模式复杂,基于贝叶斯网络构建故障诊断分析模型,通过结构学习和模型验证生成故障智能分析算法[8]。
(1)模型构建:将贝叶斯网络划分为故障特征层、故障类型层和故障原因层等3层。其中,故障特征层经过故障文本预处理后得到;故障类型层通过故障数据处理并结合车载设备结构划分来确定;故障原因层为故障原因,可直接定位到故障发生的最小单元。根据各层节点间内在联系,可建立基于专家知识的贝叶斯故障诊断网络模型。
(2)结构学习:采用K2算法对生成的贝叶斯故障诊断网络模型结构进行结构学习,包括基于约束的结构学习和基于评分搜索的结构学习。基于约束的结构学习在数据集上对各节点进行独立性测试,以确定节点间依赖关系;基于评分搜索的结构学习通过遍历所有可能的贝叶斯网络结构,并利用评分函数对其进行评分,选取分数最高的结构模型。通过采用在数据结构完整条件下进行极大似然参数估计(MLE, Maximum Likelihood Estimation)和贝叶斯估计(Bayesian estimation),以及在数据结构缺失条件下的期望最大化算法(Expectation-Maximization)进行参数学习,确定各节点的条件概率,以改善贝叶斯故障诊断网络模型的拟合效果。
(3)模型验证:采用因果推理、诊断推理和支持推理方法,对结构学习后的贝叶斯网络模型进行验证,提高故障智能分析的准确性。
5 系统应用
5.1 预防性维修支持
在列控车载设备日常运用过程中,其板卡上存在的某些故障隐患通常很难及时被发现和处置,例如散热用风扇安装在机柜内,日常检修检查时无法通过目视确认其状态,需要定期下载数据查看其运行状态,确认其是否存在异常。在线监测及智能分析系统通过实时监测列控车载设备的运行状态,基于完整的列控车载设备运行数据,利用大数据分析技术,对列控车载设备实际运行时长及运行期间历史故障情况进行统计分析,对列控车载设备各单元及子模块的健康状态进行跟踪及预测,提醒用户进行预防性维修。
5.2 常见故障应急处置
当在线监测及智能分析系统检测到列控车载设备发生潜在故障时,能够自动下载故障相关日志数据,自动分析故障原因,并提供具体的故障应急处置指导建议,帮助现场提高故障应急处置效率。
(1)BTM故障应急处置:针对BTM状态异或运行时的丢应答器丢失问题,在线监测及智能分析系统在对故障日志数据进行智能分析后可准确定位故障原因,会给出准确处置建议,避免因处置不及时或应急处置不彻底,在后续运行时同一故障再次发生造成的停车或影响运营情况的发生。
(2)单系无线通道故障应急处理:车载设备开机后有时会出现单系无线通道故障,此类故障一般只会发生在设备启动过程中,因故障具有隐蔽性、不影响司机发车,极易被忽略。在使用在线监测及智能分析系统后,可自动弹窗报警,并给出重启列控车载设备的处置建议,避免列控车载设备后续运行时出现单电台运行情况。
(3)单系安全计算机故障应急处理:在列车出库或出所的过程中,当发生因地面载频不稳导致列控车载设备单系故障时,因不影响列控设备正常运行而被忽视,但在后续运行存在另一系故障后造成停车的风险。在使用在线监测及智能分析系统后,可自动弹窗报警,并给出重启列控车载设备的处置建议,避免安全计算机单系运行,可有效降低停车风险。
6 结束语
在线监测与数据智能分析系统通过在CTCS3-300H型列控车载设备机柜中加装车载数据下载单元,统一了列控车载设备各单元日志数据的采集和传输接口;依托既有DMS车地无线传输平台,设计了灵活、务实的车地数据传输方案,实现了用于列控车载设备状态在线监测的事件通告信息的实时传输,提供故障日志自动下载、手动按需下载两种日志数据无线下载方式,并结合故障数据分析的需要,将自动车载日志数据的下载过程依据数据分析的不同阶段划分成若干步骤,在满足列控车载设备状态在线监测和故障分析需要的前提下,最大限度地减少了车地数据传输量,避免对既有DMS造成不利影响。除了简化以往列控车载设备繁琐的日志数据采集工作,该系统通过有效利用列控车载设备日志数据进行智能分析,能够快速、准确定位故障原因,实现故障自动报警并给出处置建议,提高了列控车载设备故障应急处置和维护效率,为动车组安全运行提供强有力的技术保障。
在线监测及智能分析系统的应用,降低了电务部门运用和维护CTCS3-300H型列控车载设备的人力物力投入,故障智能分析功能降低了故障分析对列控车载设备运维人员技术水平的依赖,车载设备状态在线监测和故障预警功能提高了故障处置的响应效率。该系统已在各铁路局集团公司陆续推广使用,为现场设备运用和维护提供了极大便利,获得用户一致好评。
下一步,将进一步完善在线监测与数据智能分析系统功能,增加TCR单元、列车自动运行(ATO)系统单元等运行记录数据的采集,以实现列控车载设备运行记录数据的完整采集。同时,结合系统在实际运行中出现的问题,着重开展智能分析算法的深入研究,提升算法的有效性和效率,进一步提升故障分析准确性。
-
[1] 张雯柏,彭翠云,张立都,等. 铁路信号集中监测智能分析与故障诊断测试脚本系统设计与实现[J]. 铁路计算机应用,2020,29(1):71-76. [2] 周志辉,王 东,王 猛. 列控车载数据无线下载与智能分析系统[J]. 铁道通信信号,2018,54(4):83-86. [3] 蔡华林. 铁路信号设备集中诊断及智能分析系统技术研究[D]. 中国铁道科学研究院,2017. [4] 国家铁路局. CTCS-3级列控车载设备技术条件:TB/T 3483-2017[S]. 北京:中国铁道出版社,2017. [5] 王心仪,程剑锋,刘育君. 基于TF-IDF加权朴素贝叶斯算法的ATP车载设备测试案例分类研究[J]. 铁路计算机应用,2022,31(12):8-12. [6] 杨春辉,孙 鹏,程 凯. 基于5G技术的动车组车载数据传输及监控系统研究[J]. 铁路计算机应用,2021,30(5):23-25,36. DOI: 10.3969/j.issn.1005-8451.2021.05.006 [7] 魏常丽,樊海峰. 基于故障树分析法故障辅助处理系统的探讨[J]. 铁道通信信号,2016,52(6):34-36. [8] 梁 潇. 基于贝叶斯网络的列控车载设备故障诊断方法[D]. 北京:北京交通大学,2016. -
期刊类型引用(3)
1. 王金兰,蔡伯根,申彦春,刘江. 列控车载设备故障样本生成质量评估方法. 中国铁路. 2025(05): 139-145 . 百度学术
2. 王鹏亮. 基于光纤传感技术的煤矿机电设备安全状态自动检测系统. 自动化应用. 2024(16): 19-22 . 百度学术
3. 席武夷. DMS与ATP智能分析系统融合方案研究. 铁道通信信号. 2024(10): 19-25 . 百度学术
其他类型引用(0)