• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

基于改进卷积神经网络的无绝缘轨道电路调谐区故障诊断

田粉霞, 杨世武, 崔勇, 武沛

田粉霞, 杨世武, 崔勇, 武沛. 基于改进卷积神经网络的无绝缘轨道电路调谐区故障诊断[J]. 铁路计算机应用, 2020, 29(6): 58-63,74.
引用本文: 田粉霞, 杨世武, 崔勇, 武沛. 基于改进卷积神经网络的无绝缘轨道电路调谐区故障诊断[J]. 铁路计算机应用, 2020, 29(6): 58-63,74.
TIAN Fenxia, YANG Shiwu, CUI Yong, WU Pei. Fault diagnosis of tuning zone of jointless track circuit based on improved convolutional neural network[J]. Railway Computer Application, 2020, 29(6): 58-63,74.
Citation: TIAN Fenxia, YANG Shiwu, CUI Yong, WU Pei. Fault diagnosis of tuning zone of jointless track circuit based on improved convolutional neural network[J]. Railway Computer Application, 2020, 29(6): 58-63,74.

基于改进卷积神经网络的无绝缘轨道电路调谐区故障诊断

基金项目: 

中国铁路总公司技术标准编制项目(17CR062)

详细信息
    作者简介:

    田粉霞,在读硕士研究生;杨世武,教授。

  • 中图分类号: U284.2;TP39

Fault diagnosis of tuning zone of jointless track circuit based on improved convolutional neural network

  • 摘要: 针对现有故障诊断中忽略调谐区故障对列车安全影响的问题,建立分路状态下机车信号电压模型,获取调谐区正常状态及不同故障状态的机车信号电压;并考虑补偿电容故障、不同道砟电阻等对机车信号电压的影响,对现有数据库进行扩充,得到调谐区故障数据集。在此基础上,采用卷积神经网络(CNN,Convolutional Neural Networks)实现调谐区的故障诊断,特征提取通过CNN中卷积层实现,并对比不同卷积层参数下诊断准确率及训练时间,选择当前条件下相对最优的卷积层参数;采用dropout函数避免训练中出现过拟合现象,并通过CNN中第2全连接层实现故障分类。针对人为构建数据集时数据标签错误的问题,通过构建标签错误数据集的方式,减小错误标签数据对训练过程的影响。测试结果表明:当信噪比为40 dB时,测试集的准确率为97.92%,即在噪声环境下,该诊断方式仍然有效。
    Abstract: To solve the problem that the influence of tuning zone fault on train safety is neglected in existing fault diagnosis, a voltage model of locomotive signal in the shunting state is established to obtain the signal voltage of locomotive in normal state and different fault state of tuning zone. Then, the initial database is expanded to obtain the data set of tuning zone fault by considering the influence of compensation capacitance fault and different ballast resistance on the signal voltage of locomotive. On that basis, Convolutional Neural Network is used to realize fault diagnosis of tuning zone. Hereinto, feature extraction is realized by convolution layer in the CNN and the relatively optimal convolution layer parameters are selected by comparing different convolution layer parameters in term of the accuracy of diagnostic and training time under current condition. Furthermore, dropout function is used to avoid overfitting in training, and fault classification is realized through the second full connection layer in the CNN. To deal with human errors in data labeling when constructing the data sets artificially, wrong labeled data sets is constructed to reduce the influence of wrong labeled data on training process. The test results show that the accuracy of the test set is 97.92% when the SNR is 40 dB and this diagnosis method is still effective in a noisy environment.
  • 铁路货运运单经历需求提报受理、进货装车、挂运出发、倒换装、到达卸车、内外交付、送货等流程[1],相较于铁路客运,其整体作业链条较长,过程复杂。货运的装车预计完成时间可为列车调度人员进行列车调度提供重要参考,对其精确预估可显著降低调度过程中存在的排队延迟,减少大量等待时延,从而提升铁路货运效率。对发起运单的客户来说,对货运时间的精准预测,特别是卸车预计完成时间的精准预测,有助于客户合理安排取货时间,提升铁路货运服务质量。目前,针对铁路货运装卸时间预测技术的研究还在起步阶段,本文从数据出发,构建梯度提升决策树模型,挖掘货运运单中的各项特征与对应装卸时间的相关性,使模型更加精准地预测货运装卸时间。

    梯度提升决策树(GBDT ,Gradient Boosting Decision Tree)是集成学习的一种经典算法,被广泛应用在工业场景中[2]。GBDT的基础模型是分类与回归树(CART ,Classification And Regression Tree)模型。

    CART模型是一个二叉树,其整体结构如图1所示。其中,每一个判断代表一次划分。其计算过程为:输入数据从树的根节点出发,经过一系列分支节点的判定后,得到目标叶子节点,并将该叶子节点中对应的数值作为树的输出结果。该数值来源于训练集中所有划分到该节点的输出值的算术平均值。

    图  1  CART模型结构示意

    CART模型的构建是一个特征空间的划分过程。切分变量 $j$ 和切分点 $s$ 的选择取决于划分后的数据 $y$ 与该集合的对应数值 $c$ 的误差。满足所有距离之和最小的 $j$$s$ 的选择,即为最优切分变量与切分点,可表示为

    $$ \mathop {\min }\limits_{j,s} \left[ {\mathop {\min }\limits_{{c_1}} \sum\limits_{{x_i} \in {R_1}(j,s)} {{{({y_i} - {c_1})}^2}} + \mathop {\min }\limits_{{c_2}} \sum\limits_{{x_i} \in {R_2}(j,s)} {{{({y_i} - {c_2})}^2}} } \right] $$ (1)

    其中,Rm 表示所训练数据中所有被划分到第 m 个叶子节点的数据的输入 x 的集合。在获得最优切分变量 $j$ 与切分点 $s$ 后,需要重新计算2个叶子节点对应的输出值。将上述步骤分别在2个子空间上递归进行,直到所有节点都不可划分。

    GBDT模型以CART模型为基础学习器,利用损失函数的负梯度在当前模型的值作为GBDT算法中残差的近似值[3]。GBDT模型的结构如图2所示。

    图  2  由3个CART构成的GBDT模型结构示意

    图2中,除第1个CART模型之外,每个CART模型学习的都是上1个CART模型的预测结果与目标输出的损失函数的负梯度。设GBDT模型的计算符号为$\mathcal{F}( \cdot )$,其中,第 $i$ 个CART模型的计算符号为${T_i}( \cdot )$,前$k$个CART模型得到的预测值记为${\mathcal{F}_k}(x)$,那么${T_k}(x)$的更新表示为

    $$ {T_k}(x) = \mathop {\arg \min }\limits_{{T_k}(x)} \left[ { - {\nabla _{{\mathcal{F}_{k - 1}}(x)}}L\left( {y,{\mathcal{F}_{k - 1}}(x) + {T_k}(x)} \right)} \right] $$ (2)

    其中,$L(y,{\mathcal{F}_{k - 1}}(x))$表示前 $k - 1$ 个CART模型的输出与目标结果经过损失函数计算出的误差值。使用负梯度代替残差,显著增加了普适性,可使GBDT模型在优化中自由选择不同的损失函数。

    本文使用国家铁路智能运输系统工程技术研究中心2021年6月铁路货运运单全流程信息中心相关数据作为实验数据集,对其进行分析处理后,形成运单数据集。

    铁路货运运单全流程信息中与货运装卸相关的数据有时间戳表和运单属性表。时间戳表统计了每条运单从需求提报到内外交付各操作流程的具体时刻;运单属性表统计了每条运单所对应的各项属性信息,包括货物属性、托运人与收货人的姓名、装卸股道的部分记录及其他信息。2021年6月铁路货运运单全流程信息中,时间戳表含有1821417条数据,运单属性表含有3498464条数据。

    在装卸车预测中,输入的10个特征为运单属性表中的收货人、托运人、装/卸车工作站、品名、装/卸车专用线、货物重量、车数、运输方式、运单类型和箱数,而输出结果即装卸车时间,来源于时间戳表,因此需要对2个表中的各项数据进行整合。2个表中共同拥有的属性有5个,分别为:运单号码、需求单号、发站名称、到站名称及制票时间。由于在实际业务中,运单号码与需求单号并不能建立一一对应的关系,为保证2个表数据的绝对对应,选择使用运单号码、需求单号、发站名称、到站名称作为匹配的关键字。匹配成功的数据共计1 096 206条。

    运单属性的数据分为离散型数据和连续型数据。离散型数据在货运运单数据集中可表现为汉字文本或代号,用于表示不同的类别。当整数作为离散型数据时,数值的大小不代表两类间的距离,仅表示分类。连续型数据表现为整数或浮点数,其数值大小具有业务含义。本文把所有离散型数据全部替换为整数类型的索引码,基于以下2点考虑:(1)由于铁路货运的数据隐私性[4-5],托运人、收货人、货物品名等数据应尽量避免明文使用,降低隐私泄露风险;(2)由于LightGBM框架可直接将数据设定为类别数据,因而支持以不同方式分别处理离散型数据和连续型数据。

    本文选择装卸车的完成时间和入线时间之差作为货运装卸任务下的目标预测值。这两个时间差以小时为单位,分别叫做装车时间和卸车时间,认为装卸车时间差不应超过7天,因此仅保留数值范围在0~168的数据项。此外,本文取入线时间对应的星期和作业时点为额外特征输入模型,以挖掘货运装卸过程中的作息规律。由于星期和作业时点都存在循环性,我们将其当作离散型数据处理。

    货运装卸车数据中的连续型数据普遍存在着“长尾”分布特征。分布较为集中的数据在总样本中占比较大,被称为头部类数据。而少量数据的数值多样性大、分布零散,被称为尾部类数据。铁路货运中,按运单统计,98%的货车数为1辆,最大货车数为73辆;98%的货物重量小于80 t,最大货物重量为4 799 t。这种不平衡会导致特征空间发生扭曲,从而忽略尾部类数据。但直接忽略尾部类数据并不适合铁路货运业务场景。为使数据分布更加合理,本文对这几类数据采用对数变换的操作,公式为

    $$ \log (1+x) \leftarrow x(x \geqslant 0), \text { 满足} \left\{\begin{aligned} &\lim \limits _{x \rightarrow+\infty} \log (1+x) \ll \lim\limits _{x \rightarrow+\infty} x \\ &\lim \limits_{x \rightarrow 0} \log (1+x) \sim \lim\limits _{x \rightarrow 0} x \end{aligned}\right. $$ (3)

    在装卸时间的评估中,计算还原后的数据以保证真实性。

    铁路货运的装车和卸车完成时间预测是基于业务生成的运单数据计算出对应的装车和卸车的预计完成时间。装卸时间受多方因素的影响[6],包括装卸线、车站工作效率、货物属性等因素,同时,这些因素之间也相互影响。

    假设已知的运单信息为${x^{(1)}},{x^{(2)}}, \cdots ,{x^{(n)}}$,其中,每一个${x^{(i)}}$表示运单信息中用于预测装卸时间的一维特征。那么,装卸预计完成时间为

    $$ \hat y = \mathcal{F}\left( {{x^{(1)}},{x^{(2)}}, \cdots ,{x^{(n)}}} \right) $$ (4)

    其目标是找到一个最优的装卸预测模型$\mathcal{F}$,使其满足在输入数据为运单特征${x^{(1)}},{x^{(2)}}, \cdots ,{x^{(n)}}$时,输出结果 $\hat y$ 与该运单的实际装卸时间 $y$ 最为接近。

    本文使用LightGBM[7]框架直接构建GBDT模型, LightGBM是实现GBDT模型常用的框架之一,相同于XGBoost[8],目前已有成熟的应用编程接口,可直接使用。本文采用48核Intel(R) Xeon(R) Silver 4214R CPU @ 2.40 GHz及256 GB内存的硬件设备,以保障海量数据下的模型训练。

    运单数据集在使用过程中被划分为3部分:(1)2021年6月20日之前(含20日)的数据为训练集;(2)2021年6月21~25日的数据为验证集;(3)2021年6月25日之后(不含25日)的数据为测试集。在训练中,由于“长尾”分布的影响,本文选择L1损失计算误差并更新参数。但L1损失容易忽略尾部类数据,因此,在输入数据中添加了不同站点装卸时间的平均数(简称:历史平均时间),辅助模型关注尾部类特征。输入的每条数据都是1个13维向量,表示输入的货运运单的13个特征。而每条输出数据只有1个维度,为装卸作业时间。

    在经过多轮训练的模型中,选择在验证集下损失值最小的模型作为最终训练结果,从而减少过拟合问题的发生。在LightGBM框架下构建GBDT模型需要多个超参数定义模型结构及训练细节,学习率、叶子节点数、最大树高、特征随机选择比例等对模型预测的准确率也会产生一定影响。本文使用Optuna库中的框架,从由9项超参数构成的50个组合中,选择最优结果作为模型的默认超参数组合。

    本文采用运单数据集对构建的GBDT模型进行训练,并采用平均绝对误差 ( MAE ,Mean Absolute Error)、均方根误差(RMSE,Root Mean Square Error)和平均绝对百分比误差( MAPE,Mean Absolute Percentage Error)3个指标对模型预测能力进行评估。

    $$ {{E_{{\rm{MAE}}} }} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i} - {{\hat y}_i}} \right|} $$ (5)
    $$ {{E_{\rm{RMSE}}}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} } $$ (6)
    $$ {E_{\rm{MAPE}}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {\frac{{{y_i} - {{\hat y}_i}}}{{{y_i}}}} \right|} $$ (7)

    上述指标的数值越低,代表预测值和真实值的误差越小,模型性能越优。与本文模型进行对比的机器学习模型有:线性回归(LR,Linear Regression)、支持向量机(SVM,Support Vector Machine)、多层感知机(MLP,Multilayer Perceptron)、决策树(DT,Decision Tree)及随机森林(RF,Random Forest)。其中,RF模型和GBDT模型采用LightGBM框架构建,其他模型均基于Scikit Learn框架构建。对货运装车和卸车任务分别进行训练和评估,统计结果如表1所示。

    表  1  不同方法对货运装卸预测指标统计
    模型MAEMAPERMSE
    装车卸车装车卸车装车卸车
    LR1.7451.9040.9980.9794.7584.839
    SVM3.7942.8633.4352.6957.6775.607
    MLP1.7972.0441.3321.2834.5475.095
    DT2.4212.2481.2111.0697.9085.731
    RF1.7551.7601.0760.9564.8864.744
    GBDT1.4131.6620.8080.8474.0704.536
    下载: 导出CSV 
    | 显示表格

    表1可知,在铁路货运装卸时间预测任务上,对于3种不同的评估指标,相对于其他模型,GBDT模型的预测误差最低。

    在铁路货运实际业务流程中,限定误差时间内的准确率是一项重要指标。假定预测装卸时间与真实装卸时间的误差在 $k$ 之内,则认定为正确预测,限定误差时间在 $k$ 内的准确率(ACC)是正确预测数量占全部预测数量的百分比,其公式为

    $$ {{ACC}_k} = \frac{1}{n}\sum\limits_{i = 1}^n {{{{I_\alpha}}_{|{y_i} - {{\hat y}_i}| < k}}} \times 100\% $$ (8)

    其中,Iα表示指示函数,当条件α满足时,其值为1,否则为0。对本文来说,ACC的值越高,代表模型越契合实际货运装卸业务场景。本文计算了限定误差时间为3 h、6 h和12 h的准确率,其结果如表2所示。由表2可知,在3个货运业务中常用的限定误差时间下,GBDT模型的准确率均优于其他模型。

    表  2  不同限定误差时间下的准确率统计
    模型ACC3ACC6ACC12
    装车卸车装车卸车装车卸车
    LR88.42%85.36%93.75%94.46%97.11%98.08%
    SVM62.87%70.49%88.51%93.84%94.78%97.60%
    MLP87.35%85.64%93.48%94.54%97.44%97.93%
    DT86.01%82.65%92.34%92.96%95.73%97.16%
    RF88.19%87.55%93.97%95.25%97.22%98.19%
    GBDT90.50%88.48%95.23%95.72%98.02%98.24%
    下载: 导出CSV 
    | 显示表格

    本文统计了输入特征的重要性,将GBDT模型中特征对应的树结点分裂的次数(该特征的使用次数)作为其重要性数值,预测过程中使用次数越多,表示该特征在模型预测中的重要性程度越高。货运装车时间和卸车时间预测的特征重要性从高到低排序分别如图3图4所示。其中,横坐标为各输入特征,纵坐标为代表特征重要性的数值,特征重要性数值越大,代表该特征对于货运装卸时间的影响越大。

    图  3  货运装车时间预测的特征重要性统计
    图  4  货运卸车时间预测的特征重要性统计

    图3图4可知,无论是装车任务还是卸车任务,托运人与收货人都极为重要。货运业务中,那些经常发起运单的托运人与收货人存在隐藏的偏好,例如与公司业务相关等,会导致其发起的运单有相似的特征。另外,相对重要的因素还有历史平均时间及作业时点。前两者衡量的是不同站点的装卸能力,而后者体现的是站点每天工作状态的周期性规律。

    本文基于GBDT模型对铁路货运装卸时间进行预测。先对数据进行预处理,获得运单中记录的各项属性数据;在LightGBM框架下构建了GBDT预测模型;并比较多个机器学习模型在预测货运装卸时间中的性能表现。实验结果表明,相较于其他模型,GBDT模型预测的结果误差最小,且在实际业务场景中,GBDT模型也可在限定误差时间内达到高的准确率。

  • [1] 陈欣. 基于粒子群支撑向量机的轨道电路故障诊断[J]. 铁路计算机应用, 2016, 25(8):56-59.
    [2] 徐绍俊. SA-BP神经网络在轨道电路故障诊断中的应用研究[J]. 铁路计算机应用, 2019, 28(11):55-58.
    [3] 中华人民共和国铁道部. 铁路信号维护规则技术标准[S]. 北京:中国铁道出版社, 2014:88-95.
    [4]

    ZHAO Linhai, ZHANG Cailin, QIU Kuanmin, et al. A fault diagnosis method for the tuning area of jointless track circuits based on a neural network[J]. Proceedings of the Institution of Mechanical Engineerings, Part F:Journal of Rail and Rapid Transit, 2013, 227(4):333-343.

    [5] 张才林. 基于神经网络的无绝缘轨道电路调谐区故障诊断方法的研究[D]. 北京:北京交通大学, 2013:9-49.
    [6] 孙上鹏,赵会兵,全宏宇,等. 基于定性趋势分析的无绝缘轨道电路电气绝缘节设备故障诊断方法[J]. 中国铁道科学, 2014, 35(1):105-113.
    [7] 张友鹏,张玉. 基于CEEMD的无绝缘轨道电路调谐区故障特征提取[J]. 铁道科学与工程学报, 2018, 15(9):2385-2393.
    [8] 贾京龙,余涛,吴子杰,等. 基于卷积神经网络的变压器故障诊断方法[J]. 电测与仪表, 2017, 54(13):62-67.
    [9]

    LI Hua, WANG Xiaoping, ZHAO Jiaxin,et al.Motor Fault Diagnosis Based on Short-time Fourier Transform and Convolutional Neural Network[J]. Chinese Journal of Mechanical Engineering, 2017, 30(6):1357-1368.

    [10] 周奇才,刘星辰,赵炯,等. 旋转机械一维深度卷积神经网络故障诊断研究[J]. 振动与冲击, 2018, 37(23):31-37.
    [11] 晁甲相. 机车信号记录器在LKJ数据误差分析中的应用[J]. 铁道通信信号, 2014, 50(9):1-4.
    [12] 杨世武,陈炳均,陈海康,等. 轨道电路对分相区暂态牵引电流干扰的抑制方法[J]. 西南交通大学学报, 2019, 54(6):1332-1341.
    [13] 杨世武,马沧海,赵明,等. 基于车-地关联分析的轨道电路失去分路验证方法[J]. 北京交通大学学报, 2016, 40(4):75-81.
    [14] 唐乾坤. 轨道电路设备牵引电流干扰防护研究[D]. 北京:北京交通大学, 2018:43-50.
  • 期刊类型引用(1)

    1. 李小庆,蔡俊平,曹记胜. 动客车“一日一图”客调命令管理安全风险的研究与对策. 太原铁道科技. 2020(02): 30-32 . 百度学术

    其他类型引用(3)

计量
  • 文章访问数:  83
  • HTML全文浏览量:  0
  • PDF下载量:  15
  • 被引次数: 4
出版历程
  • 收稿日期:  2019-11-10

目录

/

返回文章
返回