Intelligent operation and maintenance data analysis system of high-speed railway EMU based on artificial intelligence
-
摘要: 针对高速铁路(简称:高铁)动车组部件故障诊断和预测的业务需求,依托动车组故障预测与健康管理(PHM,Prognostic and Health Management)系统,在基于人工智能的高铁动车组智能运营维护(简称:运维)算法研究平台中构建高铁动车组智能运维数据分析系统。介绍了高铁动车组智能运维算法研究平台的架构,以及高铁动车组智能运维数据分析系统的数据处理流程和关键算法。并以高铁动车组客室空调为例,选取客室空调相关传感器数据进行数据分析,得到影响客室空调健康状况的特征,并对聚类结果进行健康度数据标注,作为客室空调健康评估模型开发的基础。
-
关键词:
- 动车组 /
- 智能运维 /
- 数据分析系统 /
- 降维和聚类 /
- 故障预测与健康管理系统
Abstract: For the business needs of fault diagnosis and prediction of high-speed railway EMU components, this paper relied on the EMU prognostic and health management system, built an intelligent operation and maintenance data analysis system of high-speed railway EMU in the intelligent operation and maintenance algorithm research platform of high-speed railway EMU based on artificial intelligence. The paper introduced the architecture of the intelligent operation and maintenance algorithm research platform for high-speed railway EMU, the data processing flow and key algorithms of the intelligent operation and maintenance data analysis system for high-speed railway EMU, took the passenger compartment air conditioning of high-speed railway EMU as an example, selected the relevant sensor data of passenger compartment air conditioning for data analysis, obtained the characteristics that affect the health status of passenger compartment air conditioning, and marked the health data of the clustering results as the basis for the development of health assessment model of passenger compartment air conditioning. -
铁路肩负着助力国家重大战略实施、支撑经济社会发展、满足人民群众出行需求的重要使命,确保铁路运输安全是铁路的工作重心[1-2]。作为电气化铁路系统核心组成部分的站场接触网,其性能的优劣直接关系到铁路运输的安全性和效率[3]。传统的接触网设备静态检测方法在复杂多变的站场环境中面临众多挑战,包括安全风险、操作复杂性及对运输秩序的潜在干扰等[4-5]。站场内多变的气候条件、不同类型的车辆人员运动,以及各种维护和建设活动,也给站场接触网检测带来了额外的困难,亟需通过技术创新来解决这些问题。
近年来,三维激光扫描技术和点云数据处理技术取得了突破性进展[6-7],为复杂站场接触网检测提供了新的可能性。点云技术以其高精准性、全天候工作、丰富的信息获取及非接触式检测的特性,成为当下业界研究的热点[8-9]。周靖松等人[10]利用深度相机与轨道车获取数据,验证了基于三维点云检测接触网方法的有效性;林凯伦等人[11]针对接触网点云数据各部件间难以区分的问题,提出了多级索引及移动向量联合的接触网提取方法,能够适应复杂的接触网场景并保障接触网提取的精度。然而,如何高效利用点云技术处理和分析接触网数据,获得满足实际检测精度要求的检测结果,并支撑运营维护(简称:运维)管理应用,依旧是一个亟需解决的难题。
鉴于此,本文设计基于激光点云的复杂站场接触网静态检测系统(简称:接触网静态检测系统)。通过集成点云处理技术和智能算法,实现对多个测量站点(简称:测站)站场接触网的高效拼接和特征提取,并能够精确计算接触网设备导高和拉出值等关键几何参数,旨在为铁路接触网非接触式静态检测技术提供更有效的解决方案。
1 系统架构
结合铁路接触网运维管理部门的实际检测作业需求和既有的硬件资源条件,本文基于Windows操作系统和Qt Creator软件开发平台,应用Visual Studio 2019和开源点云库(PCL,Point Cloud Library) 进行接触网静态检测系统的设计与开发,系统架构如图1所示。
1.1 技术支撑层
应用激光相位扫描技术,以Faro三维激光扫描仪为例,10 m位置处三维位置精度达到±2 mm;结合可视化工具包(VTK,Visualization Toolkit)等三维点云可视化引擎技术,实现复杂站场接触网点云数据的高效渲染和展示;应用PCL库中的机器学习算法,能够显著提高点云数据的处理效率和分析精度;C++语言的高性能和Qt跨平台灵活性共同确保软件开发的可靠性和易用性。
1.2 数据层
对导入的站场接触网区域多个测站(简称:多站)三维点云数据进行存储和管理,形成复杂站场接触网的场景数据集;提供对数据集的质量检查、数据裁剪、坐标转换、格式转换等数据基础处理服务;提供对计算得到的站场接触网设备导高和拉出值等关键几何参数信息的存储与管理。
1.3 核心功能层
负责实现站场接触网场景的快速建模和优化,以及接触网静态几何参数的智能精准计算;支持用户根据个性化需求对点云滤波、抽稀、配准及特征提取等算法的初始参数进行自定义设置,增加了系统的适用性和灵活性。
1.4 应用层
提供可视化交互式用户界面,主要负责展示点云基础处理方法、点云场景融合重构和接触网静态几何参数计算等功能,对接触网导线超限提出预警,为运维检修提供辅助决策。
2 系统功能
为满足铁路接触网设备现场检测人员的实际工作习惯和业务需求,采用模块化设计理念设计接触网静态检测系统的功能,主要包括基础功能、多站点云融合、目标要素提取,以及几何参数计算等,如图2所示。
2.1 基础功能
包含导入/导出、距离量测、属性变换及点云优化组织。其中,导入/导出功能支持读取和保存多种格式的点云文件,如pcd、ply、txt和las格式,满足不同数据来源的需求;距离量测功能提供易于操作的视图控件,支持任意两点间的距离计算;属性变换功能支持对点云数据的大小、渲染颜色、坐标等属性进行任意变换,提高点云数据的辨识度和可操作性;点云优化组织功能提供直通滤波、体素滤波、统计滤波及半径滤波功能,实现在保留原有点云特征的前提下,有效降低点云数据量,从而提高数据处理的效率和准确性。
2.2 多站点云融合
包括关键点提取、快速匹配及精细配准,用于解决多站的点云数据在不同站场区域的高精度配准和无缝拼接问题,实现全站场接触网设备的三维点云数据的综合表示。其中,关键点提取功能集成了内部形态描述子(ISS,Intrinsic Shape Signatures)关键点检测算法,能够识别和计算点云数据中的显著特征点,为后续的数据融合奠定基础;快速匹配功能集成了4点全等集(4PCS,Four Point Congruent Sets)和随机样本一致(RANSAC,Random Sample Consensus)配准算法,可对多站的点云数据进行快速配准,达到粗配准效果;精细配准功能集成了最近点迭代(ICP,Iterative Closest Point)全局优化配准算法,在多站点云粗配准的基础上,实现精确配准。
2.3 目标要素提取
包括接触网线提取和钢轨提取,前者集成了一种基于线性特征和高程位置分布特征的提取算法[12],能够一次性提取接触网点云数据中的线性结构,包含的结构主要有接触网导线、承力索与吊弦等;后者支持钢轨顶面的准确分割,能够处理复杂站场环境中的钢轨数据,即便在多线并行或交叉的情况下也能保持高效和准确。
2.4 几何参数计算
包括导高计算和拉出值计算,前者能够精确计算接触网接触线上的任意一点到钢轨顶面的垂直距离;后者能够计算接触网接触线上的任意一点相对于钢轨中心位置的水平偏移量。接触网静态几何参数的计算对于确保安全运行至关重要,该模块能够提供接触网设备导高和拉出值的精准计算,精确到毫米级。
3 关键技术
3.1 多站点云快速精确配准
针对站场接触网点云数据存在的场景复杂、噪声影响大和测站数量多等问题,传统的点云配准方法难以高效形成连续且高精度的站场接触网点云模型,本文采用了一种多阶段融合策略,多站接触网点云数据配准流程,如图3所示。
配准流程为:
(1)采用ISS关键点检测算法,识别和计算出点云数据中具有显著结构的关键点;
(2)针对关键点构建快速点特征直方图(FPFH,Fast Point Feature Histograms)特征描述子,通过源点云与目标点云对应点的特征描述子最相近求得对应关系;
(3)分别采用4PCS和RANSAC算法进行多站点云的粗配准,其中,4PCS算法针对大规模数据集进行高效的初始对齐,RANSAC算法用于滤除异常数据,完成多站点云快速匹配;
(4)通过对两个测站的点云进行整体随机下采样,降低由点云密度引起的时间复杂度;
(5)采用ICP算法进行点云精配准,利用K维(KD,K-Dimensional)树加速ICP算法的对应点搜索速度,通过迭代优化确保最高水平的配准精度,从整体上提升点云配准的精度与效率。
该融合策略的目标是计算获取ICP算法的最优变换矩阵。假设源点云P的点云数据集记为
$ \left\{{{\boldsymbol{p}}}_{i}\right\} $ ;目标点云$ Q $ 的点云数据集为$ \left\{{{\boldsymbol{q}}}_{i}\right\} $ ;N为点集的规模;旋转变换矩阵为R;平移变换矩阵为t;E(R, t)表示源点云集P在变换矩阵(R, t)下与目标点集Q之间的误差,表示为$$ E\left({\boldsymbol{R}},{\boldsymbol{t}}\right)=\dfrac{1}{N}\sum _{i=1}^{N} \parallel {{\boldsymbol{q}}}_{i}-{\boldsymbol{R}}{{\boldsymbol{p}}}_{i}-{\boldsymbol{t}}{\parallel }^{2} $$ (1) 则求解最优变换矩阵的问题就可以转化为求满足min(E(R, t))的最优变换矩阵(R, t),为后续的要素分析和提取提供了准确的空间参照。
3.2 接触网点云要素提取
针对接触网接触线和钢轨要素的提取需求,本文提出一种基于最近邻域匹配的接触网点云要素提取流程,如图4所示。
3.2.1 接触线点云提取
结合站场接触网设计参数约束,采用一种基于线性特征和高程位置分布特征的提取算法,如图5所示。
(1)在点云环形邻域的基础上,通过进一步限制邻域点的角度范围,以更快速地估计接触线特征。例如,规定正北方向为0°的坐标内,选择顺时针旋转角度范围为70°~110°的两个平面间的点云作为该定位点的邻域范围,旨在扩大所述接触线的点云数据的线性特征,并减少局部噪声及电力要素连接处的影响,从而更快速地反映站场接触网线状物体的几何特征。
(2)借助接触线点云邻域高程差异进行水平导线分割,即使用下半球半径邻域搜索策略去除接触线上方点云的干扰,通过KD树搜索邻域的点,并计算邻域点的最大高差,使用更严格的阈值剔除干扰点。
3.2.2 钢轨点云提取
与接触网导线的“之”字形分布不同,钢轨在站场内通常呈直线分布,并且高度特征保持一致。针对钢轨顶面线性和高度特征,本文应用一种基于主动采样的钢轨顶面点云鲁棒提取方法。该方法以P60钢轨的轨面宽度、轨距及钢轨间高差为约束规则,如图6所示,利用RANSAC拟合算法提取钢轨顶面点云,有效实现了钢轨顶面的准确分割,能够处理复杂站场环境中的钢轨数据,即便在多线并行或交叉的情况下也能保持高效和准确。
3.3 接触网静态几何参数计算
在铁路系统中,接触网静态几何参数的检测对于确保安全运行至关重要。导高即导线高度,即计算接触线到钢轨顶面的垂直距离,计算过程为:
(1)从接触线的点云数据中任意选取一个定位点M;
(2)基于最近邻搜索算法从离该定位点最近的两组钢轨顶面的点云数据中各选出
$ n $ 个最近点,并分别求取各组钢轨顶面的点云数据的三维坐标平均值$ {{P}}_{1} $ 和$ {P}_{2} $ ;(3)计算两个三维坐标平均值的高程平均值
$ {Z}_{0} $ ;(4)计算接触线的导高值
$ H={Z}_{M}-{Z}_{0} $ ,其中,ZM为定位点M的高程。接触线拉出值是接触网线相对钢轨中心位置的水平偏移,即接触线的定位点M在钢轨顶面的投影点
$P^{\prime} $ 到轨道中心线段$ {P}_{1}{P}_{2} $ 中点的距离。投影点$ P^{\prime} $ 的计算公式为$$ \begin{array}{c}{P}^{'}={P}_{1}+\dfrac{S}{D}\cdot \overrightarrow{{\boldsymbol{d}}}\end{array} $$ (2) 式(2)中,
$ \overrightarrow{{{\boldsymbol{d}}}} $ 为直线$ {{P}}_{1}{{P}}_{2} $ 的方向向量;S为接触线上定位点M到$ {{P}}_{1}{{P}}_{2} $ 直线方向的点积;D为直线方向向量的长度的平方。拉出值a的计算公式为
$$ a=\left\|P^{\prime} P_0\right\|=\left\|{P}^{\prime}-P_0\right\|$$ (3) 式(3)中,P0为轨道中心线段P1P2中点坐标,即接触线对钢轨中心位置的水平偏移。
4 应用验证
4.1 实验数据采集
本文选取天津西高铁站(包括13个站台和26条股道)作为实验场景,对本系统进行应用验证。实验中使用了HIS1000i和FARO Focus S150两款三维激光扫描仪,用于复杂站场接触网点云数据的采集。
4.2 站场接触网静态参数检测应用
4.2.1 多站点云融合应用
通过多站点云融合功能模块,处理来自不同测站的大量接触网设备点云数据,极大地提高点云数据的连续性和整体覆盖范围,实现站场接触网的完整三维重建。图7是经多站点云融合建立的站场整体场景模型,展示了本系统在点云处理和可视化方面的能力。
4.2.2 目标要素提取应用
通过目标要素提取功能模块,精细地提取接触网接触线和钢轨顶面要素。图8是接触线和钢轨的精细提取效果,显示出本系统在关键要素几何特征精确识别方面的优势。
4.2.3 静态几何参数计算应用
通过几何参数计算模块,自动计算并管理接触网设备导高和拉出值。同时,提供静态检测历史数据的比较、分析功能,帮助接触网设备运维管理人员全面掌握设备状态,为其科学决策提供重要依据。
4.3 应用结果分析
在天津西高铁站的应用结果表明,在试验段100 m站场范围内,本系统对接触网导高和拉出值的计算结果精度达到±5 mm,如表1所示,计算精度满足《高速铁路接触网运行维护管理规程》要求。
表 1 天津西高铁站接触网导线参数计算结果序号 导高/
mm实测导高/
mm导高差值/
mm拉出值/
mm实测拉出值/
mm拉出值差值/
mm1 5307 5311 −4 194 201 −7 2 5300 5295 5 197 203 −6 3 5305 5311 −6 215 212 3 4 5303 5307 −4 220 215 5 5 5300 5294 6 223 223 0 6 5302 5297 5 234 235 −1 5 结束语
本文利用Qt Creator作为开发平台,设计接触网静态检测系统,集成点云预处理、点云配准融合及特征提取算法,能够显著提升接触网静态几何参数计算的效率和精度。本文的研究成果不仅能有效提升铁路接触网运维管理部门的工作效率,消除一定的设备安全隐患,且为铁路供电系统智能化管理和维护提供坚实的技术基础。接下来,将进一步研究提高接触网点云数据预处理、配准、特征提取及几何参数计算的精度与效率,并从站场接触网数字孪生场景搭建和设备智能维修养护两个方向拓展系统的智能化功能,加快推进铁路接触网设备运维走向数字化、智能化。
-
表 1 客室空调特征列表
序号 特征 序号 特征 1 客室温度 6 压缩机1高压值 2 客室空调送风温度 7 压缩机1低压值 3 室外温度 8 压缩机2高压值 4 车速 9 压缩机2低压值 5 客室空调模式 10 客室空调通风状态 表 2 扩展后的客室空调特征列表
序号 特征 序号 特征 1 客室温度 10 客室空调通风状态 2 客室空调送风温度 11 客室温度移动平均值MA5 3 室外温度 12 客室温度相邻数据差值 4 车速 13 室外温度移动平均MA5 5 客室空调模式 14 车速移动平均值MA5 6-9 压缩机高低压 15-16 压缩机高低压差 表 3 各类数据对应的主导特征列表
类别 主导特征 A 室温连续5 min ≥ 28.5℃或
30 min内出现2次
及以上连续5 min内相邻室温数据差值 ≥ 2℃B 30 min内出现1次连续5 min内前后室温数据差值
≥ 2℃或
30 min内出现2次及以上连续5 min
相邻室温数据差值 ≥ 1.5℃C 30 min内出现1次连续5 min内相邻室温数据差值 ≥ 1.5℃ D 其他 -
[1] Hess A , Calvello G , Dabney T . PHM a key enabler for the JSF autonomic logistics support concept[C]// IEEE Aerospace Conference. Big Sky, Montana, USA: IEEE, 2004: 547-556.
[2] 中国国家铁路集团有限公司. 国铁集团机辆部关于动车组故障预测与健康管理(PHM)系统试运行的通知: 机辆动客电[2020]376号文件[A]. 北京: 中国国家铁路集团有限公司, 2020. [3] 廖小东,周 斌,谢名源. 动车组客室空调制冷剂不足故障诊断模型 [J]. 城市轨道交通研究,2019,22(11):52-57,62. DOI: 10.16037/j.1007-869x.2019.11.012 [4] 廖小东,叶 丹,谢名源,等. CRH380B(L)型动车组主变压器散热装置维修决策优化研究 [J]. 铁道机车车辆,2018,38(1):81-87. DOI: 10.3969/j.issn.1008-7842.2018.01.20 [5] Li Z, Jiang W, Zhang S, et al. A Hydraulic Pump Fault Diagnosis Method Based on the Modified Ensemble Empirical Mode Decomposition and Wavelet Kernel Extreme Learning Machine Methods [J]. Sensors, 2021, 21(8): 2599. DOI: 10.3390/s21082599
[6] Toma R N , Prosvirin A E , Kim J M. Bearing Fault Diagnosis of Induction Motors Using a Genetic Algorithm and Machine Learning Classifiers [J]. Sensors (Basel, Switzerland), 2020, 20(7). DOI: 10.3390/s20071884.
[7] Bellman Richard E. . Dynamic Programming[M]. Princeton : Princeton University Press, 2010.
[8] Jolliffe I T. Principal Component Analysis [J]. Journal of Marketing Research, 2002, 87(4): 513.
[9] Maaten L V D. Accelerating t-SNE using tree-based algorithms [J]. Journal of Machine Learning Research, 2014, 15(1): 3221-3245.
[10] Mcinnes L, Healy J. UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction [J]. The Journal of Open Source Software, 2018, 3(29): 861. DOI: 10.21105/joss.00861
[11] Tan Bo, Teng Guang-jin, Wang Hao. Research on customer relationship and risk warning based on big data [J]. Tsinghua Financial Review, 2017(8).
[12] 姜 陈,周 斌,廖小东. 基于BP神经网络的动车组客室空调故障识别与预警研究 [J]. 铁道标准设计,2018,62(2):173-179. DOI: 10.13238/j.issn.1004-2954.201702030002