Construction and Application Exploration of Railway Signal Intelligent Operation and Maintenance Large Model
-
摘要:
针对铁路信号领域设备种类繁多、数据分散的现状,探索利用人工智能大模型技术实现传统信号运营维护(简称:运维)智能化升级的路径。分析铁路信号运维在数据治理、故障诊断等方面的核心问题,选择DeepSeek-R1作为基础模型,通过接口扩展实现多源异构数据的标准化治理,构建统一的数据处理流程;采用分层学习机制与混合微调策略,结合增量学习、小样本学习等技术,提升基础模型对动态数据的适应性及罕见故障的诊断能力;设计设备智能诊断、智能问答助手和预防性维护等3个核心应用场景,推动大模型在铁路信号运维中的实际落地,降低人工运维成本。研究成果为铁路信号系统智能化升级提供了可行的技术方案与实践参考。
Abstract:In response to the diverse types of equipment and scattered data in the field of railway signaling, this paper explored the path of using artificial intelligence large model technology to implement intelligent upgrading of traditional signal operation and maintenance. The paper analyzed the core issues of railway signal operation and maintenance in data governance, fault diagnosis, and other aspects, chose DeepSeek-R1 as the basic model to implement standardized governance of multi-source heterogeneous data through interface extension, and built a unified data processing flow, adopted a hierarchical learning mechanism and a hybrid fine-tuning strategy, improved the adaptability of the basic model to dynamic data and the diagnostic ability for rare faults by combining techniques such as incremental learning and small sample learning. It designed three core application scenarios, including intelligent diagnosis of equipment, intelligent question and answer assistant, and preventive maintenance to promote the practical implementation of large models in railway signal operation and maintenance, and reduce manual operation and maintenance costs. The research results provide feasible technical solutions and practical references for the intelligent upgrade of railway signal system.
-
逆变器是列车牵引传动系统中的重要组成部分,经常处于高压高频状态,且在列车运行过程中存在不确定性因素,使得逆变器易产生各种故障,其最常见的故障为绝缘栅双极型晶体管(IGBT,Insulated Gate Bipolar Transistor )开路故障。IGBT开路故障又分为单管开路、双管开路、三管及以上开路故障。其中,单管开路故障特征明显,且诊断较为简单;双管开路故障危害更大且故障特征更加复杂;三管及以上的开路出现故障的几率很小,通常不作考虑。因此,本文仅对双管开路故障的情况进行分析,及时定位故障的位置,可提高检修效率,降低维修成本,对列车的维修具有重要意义。
目前,基于信号处理和机器学习相结合的故障诊断方法是研究的热点。Kou L等人[1]采用知识驱动和随机森林技术,对中性点箝位型逆变器IGBT开路进行故障诊断,取得了较好的诊断效果;钱存元等人[2]利用经验模态分解(EMD, Empirical Mode Decomposition)方法处理信号,再利用反向传播(BP, Back Propagation)神经网络进行故障诊断,实现了较高精度的故障诊断;赵智强等人[3]针对电容的老化进行故障诊断,采用自适应白噪声完整集合EMD与小波能量熵结合的特征提取方法,并利用改进的最小二乘支持向量机实现了Z源逆变器的故障诊断,准确率达到99.6%;孟建军等人[4]针对列车的辅助逆变器中IGBT开路故障进行研究,对故障信号进行小波重构建立了BP与广义回归神经网络,在保有较高精度的同时提高了迭代速度;陶洪峰等人[5]结合EMD及决策树相关向量机,实现了对二极管箝位型三电平逆变器的故障诊断,该方法可减少人为设置参数的数量,避免参数设置不合理对诊断结果产生的影响;Yang等人[6]将三相电流平均值作为故障特征,采用GA-ACO-BP算法实现故障在线检测。
上述研究均取得了一定成果,但在列车的逆变器模块中,不同列车电路结构不同,且控制算法也不同。因此,本文针对CRH3C型动车组逆变器的IGBT双管故障进行研究。建立双电平电压源型逆变器模型,控制器采用空间矢量脉宽调制 (SVPWM ,Space Vector Pulse Width Modulation)算法,并对IGBT双管故障进行仿真,得到故障信号。再通过EMD-非洲秃鹫优化算法(AVOA ,African Vultures Optimization Algorithm)-BP方法,构建故障诊断模型,对故障信号进行识别,从而实现逆变器故障诊断。
1 逆变器建模及故障分析
1.1 CRH3C型动车组逆变器建模
CRH3C型动车组逆变器包含直流输入、逆变桥、牵引电机、速度传感器、电流传感器及控制器。其中,控制器采用SVPWM算法,由速度传感器和电流传感器得到当前牵引电机的转速和三相电流,并输出开关信号控制IGBT的通断,从而控制牵引电机。 SVPWM控制器控制方式为转子磁链定向的矢量控制,该方法采用坐标变换的方法将牵引电机的动态模型进行简化,令坐标变换后的d轴与转子磁链方向重合,将交流牵引电机的物理模型转换为类似直流电机的物理模型,控制方式也采取类似直流电机的闭环调速。
在控制牵引电机时,分别记三相逆变桥为a、b、c,每一相都有两种工作状态,用1表示上桥臂导通,用0表示下桥臂导通,因此,三相组合一共有8种开关状态,SVPWM控制器对应构造了8个基本电压矢量,8种基本电压矢量V0~V7的分布及逆变桥的结构如图1所示。
图1(b)中,T1~T6为逆变器的6个IGBT,直流输入电压为Ud。对于牵引电机所需要的任何电压均可由所在扇区相邻的2个基本电压向量合成,每个基本电压向量的作用时间由SVPWM控制器计算求得[7]。与传统的脉冲宽度调制(PWM,Pulse Width Modulation)方法相比,SVPWM控制器有着更高的直流电压利用率,更小的谐波成分,以及更低的转矩波动。逆变器控制框图如图2所示。
图2中
ω∗m 与ωm 分别为牵引电机期望转速与实际转速;ia 、ib 、ic 为三相定子电流的检测值;ids 与iqs 为d-q坐标系下定子电流的检测值;θ 为转子磁链的角度;i∗ds 与i∗qs 为d-q坐标系下定子电流的期望值;v∗d 与v∗q 为d-q坐标系下的期望电压。本文根据图2在Simulink中搭建如图3所示的逆变器仿真模型,该模型中的牵引电机参数如表1所示[8]。表 1 牵引电机参数参数名称 数值 参数名称 数值 极对数 2 转子电阻Rr 0.16 Ω 转子漏感Llr 0.6 mH 转动惯量J 5 kg·m2 定子漏感Lls 1.42 mH 互感Lm 25.4 mH 定子电阻Rs 0.15 Ω 额定功率 562 kW 1.2 故障分析
一个逆变器中包含6个IGBT,其开关信号由SVPWM控制器发出。相对于单管开路故障,双管开路故障发生时电流畸变更加严重,对牵引电机转速影响也更为明显。双管开路故障又分为同桥臂故障与不同桥臂故障,共包含15种故障情况和1种无故障情况,用1代表IGBT发生故障、0表示IGBT正常,并以T1~T6的6位编码作为故障标签,例如,T1T2双管故障标签为110000。
当无故障发生时,三相电流呈现相位互差120°的正弦波形,如图4所示,其电流最大幅值为100 A左右。
设定半载匀速运行为列车的运行状态,发生故障时,将逆变器仿真模型中对应的故障管同时断开连接,由于故障种类较多,仅以T1T2、T1T4、T1T5及T4T5为例,其双管开路故障三相电流波形如图5所示。图5中,电流波形与正常运行时对比发生不同程度的畸变,电流最大幅值明显增加,导致其他元件处于过载状态,不仅对于整个电路的寿命产生严重影响,对列车的安全运行也有严重的影响。
2 EMD-AVOA-BP方法
2.1 故障特征提取
2.1.1 EMD去噪处理
由三相电流信号的波形可知,信号中存在着许多毛刺,可能会对最终故障诊断的效果产生影响,因此,先对三相电流信号进行EMD去噪处理。EMD去噪需要对信号进行分解,将原始信号分解成一系列内涵模态分量及残余分量,去除高频分量后再将其余分量重构,形成新的信号。EMD分解的步骤如下[9]:
(1)求原始信号x(t)上下极值点,并求得上、下包络线及其均值m(t) ,画出均值包络线;
(2)用原始信号减均值包络线,得到中间信号s(t)=x(t)−m(t);
(3)判断该s(t)是否满足本征模态函数(IMF,Intrinsic Mode Functions)的2个约束条件,若满足,该信号就是一个IMF分量,记为c(t);否则,重复(1)~(3);
(4)求得第一个IMF分量后,将原始信号减去该IMF分量,作为新的原始信号继续分解,重复以上步骤直到IMF分量小于预设值或残余分量为单调函数,此时EMD分解结束,并剩余一个残余分量r(t)。本征模态函数的约束条件为,在数据中信号极值点个数与过零点个数相差小于 2,并且,信号的上下包络线要关于时间轴对称。
通常,信号中包含的噪声为高频量,因此,将IMF分量中频率最高的分量去除,将其余分量重构得到新的无噪声平滑信号。去噪后的三相电流波形比较如图6所示,去噪后的信号高频毛刺明显减少,波形更加光滑。
2.1.2 EMD故障特征提取
在去除信号中代表噪声的最高频的IMF1分量后,剩余IMF2~IMF10(本文中电流信号最多分解到第10层)及残余分量r(t),将其能量占比作为EMD故障特征,计算步骤如下。
(1)第
i 个IMF分量的能量Ei为Ei=n∑j=1p2ij (1) 式(1)中,i=2, 3, ···, 10,
pij 为第i 个IMF分量中第j个样本点的幅值,n 为样本点个数。(2)残余分量的能量Er为
Er=n∑j=1q2j (2) 式(2)中,
qj 表示残余分量r(t)中第j个样本点的幅值。(3)总能量Et为
Et=Er+10∑i=2Ei (3) (4)以各分量的能量占比作为故障特征向量H,其公式为
H=[E2Et,E3Et,…,E10Et,ErEt] (4) 分别求取三相定子电流的故障特征
Ha 、Hb 、Hc ,令T=[Ha,Hb,Hc] 。2.2 AVOA- BP故障诊断模型
BP神经网络是一种多层的、向前反馈的神经网络。在分类时,当预测类别与实际类别不符时,则反向传播误差,并不断调整神经网络的权重阈值,最终达到分类目的。但BP神经网络也存在许多缺陷,例如,对初始权重阈值较敏感,易陷入局部最优,导致训练误差较大,且多次重复训练得到的结果都有较大差别。针对上述问题,本文采用AVOA对BP神经网络初始的权重和阈值进行优化,优化后的BP神经网络即为AVOA - BP 故障诊断模型。
AVOA通过模拟非洲秃鹫的觅食和航行行为进行问题寻优,具有寻优能力强、收敛速度快等特点。AVOA优化BP神经网络的流程如图7所示[10],将BP神经网络误差作为饱食度,指导秃鹫种群中每个秃鹫进行位置更新,每个秃鹫所在的位置都代表了BP神经网络中初始权重和阈值的一组取值。其算法主要步骤如下。
(1)初始化参数及种群。设置算法超参数P1、P2、P3分别为0.6、0.4、0.6,该参数用于控制更新策略。随机生成0~1之间的随机数:randp1、randp2、randp3。
(2)计算适应度并选取最优秃鹫B1与次优秃鹫B2,其他秃鹫按式(5)向最优解或次优解移动
R(i)={B1 if pi=L1B2 if pi=L2 (5) 式(5)中,
i 为当前迭代次数;L1、L2为选择最优秃鹫与次优秃鹫的概率参数,二者均在0~1之间,且二者和为1;R(i)表示被选中的最优秃鹫或次优秃鹫,pi 为选择概率,其公式为pi=Fin∑i=1Fi (6) 式(6)中,Fi表示第i次迭代中秃鹫的饱食度;n为总迭代次数。
(3)更新参数
t 、z ,并计算秃鹫饱食度F ,计算公式为t=h⋅((sin(π2⋅k))w+cos(π2⋅k)−1) (7) F=(2⋅rand1+1)⋅z⋅(1−k)+t (8) 式(7)、式(8)中,参数t的引入有助于防止算法陷入局部最优解,使算法增加进入探索阶段的概率;w设置为2.5,该值越大进入探索阶段的概率越大;
h 是介于−2~2之间的随机数;z 是介于−1~1之间的随机数,且每次迭代都会改变,当z <0 ,表示秃鹫处于饥饿状态;k 为当前迭代次数与最大迭代次数的比值。(4)根据饱食度F选取当前进行的阶段,当
|F|⩾ 进行探索阶段,该阶段秃鹫会进行大范围搜索;否则进入开发阶段,秃鹫在小范围进行精细搜索。(5)进行探索阶段时,根据参数
{P_{\text{1}}} 确定该阶段的搜寻策略,当{P_{\text{1}}} \geqslant ran{d_{p1}} 时,个体位置更新方式采用式(9),否则采用式(10)。P(i + 1) = R(i) - \left| {X \cdot R(i) - P(i)} \right| \cdot F (9) P(i + 1) = R(i) - F + ran{d_2} \cdot ((ub - lb) \cdot ran{d_3} + lb) (10) 式(9)、式(10)中,
P(i) 为当前迭代中秃鹫的位置矢量;X 为每次迭代变化的随机运动参数,是0到2 之间的随机数;ub 与lb 分别代表待优化参数的上下界。(6)
\left| F \right| 在0.5~1之间时,秃鹫位置更新策略取决于{P_2} 与随机参数ran{d_{p2}} 的关系,当{P_2} \geqslant ran{d_{p2}} 时采用式(11),否则采用式(12)。P(i + 1) = \left| {X \cdot R(i) - P(i)} \right| \cdot (F + ran{d_4}) - {R_i} + {P_i} (11) P(i + 1) = R(i) - ({S_1} + {S_2}) (12) {S_1} = R(i) \cdot \frac{{ran{d_5} \cdot P(i)}}{{2\pi }} \cdot \cos (P(i)) (13) {S_2} = R(i) \cdot \frac{{ran{d_6} \cdot P(i)}}{{2\pi }} \cdot \sin (P(i)) (14) 式(11)~式(14)中,
ran{d_4} 、ran{d_5} 、ran{d_6} 均为0~1间的随机数。(7)当
\left| F \right| < 0.5时,秃鹫位置更新策略取决于{P_3} 与随机参数ran{d_{p3}} 的大小关系,当{P_3} \geqslant ran{d_{p3}} 时采用式(15),否则采用式(16)。P(i + 1) = \frac{{{A_1} + {A_2}}}{2} (15) P(i + 1) = R(i) - \left| {d(t)} \right| \cdot F \cdot Levy(d) (16) 式(15)~式(16)中,
d 表示每个秃鹫的维度;d(t)表示秃鹫到最优秃鹫或次优秃鹫的距离;相关参数及函数计算方法为{A_1} = {B_1}(i) - \frac{{{B_1}(i) \cdot P(i)}}{{{B_1}(i) - P{{(i)}^2}}} \cdot F (17) {A_2} = {B_2}(i) - \frac{{{B_2}(i) \cdot P(i)}}{{{B_2}(i) - P{{(i)}^2}}} \cdot F (18) Levy(x) = 0.01 \cdot \dfrac{{u \cdot \sigma }}{{{{\left| v \right|}^{\frac{1}{\beta }}}}} (19) \sigma = {\Biggr(\frac{{\Gamma \left(1 + \beta \right) \cdot \sin \left(\dfrac{{\pi \beta }}{2}\right)}}{{\Gamma \left(\dfrac{{1 + \beta }}{2}\right) \cdot \beta \cdot {2^{\frac{{\beta - 1}}{2}}}}}\Biggr)^{\frac{1}{\beta }}} (20) 式(17)~式(20)中,
\beta = 1.5 ;B1(i)、B2(i)分别表示第i次的迭代最优秃鹰和次优秃鹰;u 与v 服从正态分布,u \sim N(0,{\sigma ^2}) ,v \sim N(0,1) 。重复步骤(2)~(7)直到达到最大迭代次数或误差满足要求。3 仿真实验与结果分析
3.1 故障诊断模型设置及训练
AVOA-BP故障诊断模型的输入为三相电流信号的EMD故障特征,输出为故障标签预测值。为了提高精度并降低网络复杂程度,对应6个IGBT,每次选取一个IGBT的标签作为网络输出,分别构建6个AVOA-BP神经网络,因此BP网络输出层仅有一个神经元。神经网络输入层神经元个数为33,由T中故障特征的个数决定。隐含层神经元数量经测试设置为70左右最佳。根据Matlab中默认的BP网络神经元连接方式,计算可知共有2 380个权值及71个阈值。设定种群大小为100,最大迭代次数为500,参数上下界分别为1和−1。
故障诊断模型设置好后,采用EMD对三相电流信号进行处理,提取特征数据。将这些数据划分为训练集和测试集,共包含16种故障标签,每种故障类型有10组数据,共160组数据,将其中130组作为训练集,其余30组作为测试集,在Matlab中编写模型训练程序,实现数据预处理及模型训练功能。
3.2 实验结果分析
由于实际值只有0或1两种取值,因此将预测结果以0.5作为阈值,低于阈值视为0,否则视为1。采用准确率(Accuracy)、均方误差(MSE,Mean-Square Error)、决定系数(R2,R-Squar)评价模型的性能。其中,准确率越高表示诊断效果越好,MSE越低表示模型预测值与实际值误差越小,R2越接近1表示模型的拟合效果越好。
为验证模型的性能,本文与采用梯度下降法的传统BP模型、采用粒子群算法(PSO,Particle Swarm Optimization)优化的BP模型及采用Levenberg-Marquardt(L-M)算法的BP模型的诊断结果进行对比。传统的BP模型通常采用梯度下降法,使网络的权值和阈值沿梯度的反方向,按一定步长大小进行更新;L-M-BP模型在梯度下降法的基础上进行了改进,通常比标准的梯度下降法收敛更快;PSO-BP模型与AVOA-BP模型类似。为保证实验的公平性,模型的网络结构均一致,优化算法的最大迭代次数和种群大小均分别设为500和100。传统BP模型和L-M-BP模型的学习率设为0.1。4类方法的实验结果如图8所示。4种模型总体性能的对比如表2所示。
表 2 模型诊断效果对比模型名称 样本数量 正确数量 MSE 准确率 R2 AVOA-BP 30 30 0.005 100% 0.939 L-M-BP 30 29 0.027 96.7% 0.878 传统BP 30 23 0.026 76.7% 0.666 PSO-BP 30 17 0.05 56.7% -0.705 由表2可知,本文设计的AVOA-BP故障诊断模型在测试集中达到了100%的故障诊断准确率,MSE值最小且R2值最大,其各项指标均优于对照组。L-M-BP模型也取得了很好的诊断效果,但分析其预测结果可知,该模型虽只诊断错了第13号样本,但该样本对应的故障标签中,存在6个标签诊断错误,同时,该很多预测值与阈值非常接近,反映出该模型的泛化性较差,易出现误诊。而传统BP模型与PSO-BP模型诊断效果均不理想,准确率较低,无法有效对逆变器故障进行诊断。
4 结束语
本文以CRH3C型动车组中的逆变器为研究对象,搭建了逆变器的仿真模型并得到故障信号,构建EMD-AVOA-BP故障诊断模型对逆变器IGBT的双管故障进行诊断,并将诊断结果与其他常用方法进行对比。经过对比可知,本文设计的EMD-AVOA-BP故障诊断模型的各项指标均优于其他模型,验证了其有效性,实现了对高速列车逆变器IGBT双管故障的精准诊断,对提高逆变器检修效率具有一定参考意义。
-
表 1 主流模型性能对比
模型特性 BERT GPT DeepSeek ChatGLM 架构类型 双向编码器 单向解码器 编码器-解码器 编码器-解码器 参数规模 110 M~330 M 1.5 B~175 B 7 B~671 B 6 B~130 B 训练数据类型 通用文本 通用文本 代码+文本 多语言文本 领域适配能力 强(双向上下文建模) 中(单向生成) 强(代码逻辑推理) 中(中文优化) 多模态支持 弱(需扩展) 弱(需扩展) 中(代码−文本对齐) 中(插件机制) 计算效率 高(编码器架构) 中(自回归生成) 高(量化支持) 高(量化优化) 工业迁移成本 低(预训练+微调) 中(指令微调) 低(代码领域优势) 中(中文生态) -
[1] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//The 31st International Conference on Neural Information Processing Systems, 4-9 December, 2017, Long Beach, USA. New York: ACM, 2017: 6000-6010.
[2] Rajapaksha P, Farahbakhsh R, Crespi N. BERT, XLNet or RoBERTa: The best transfer learning model to detect clickbaits[J]. IEEE Access, 2021(9): 154704-154716. DOI: 10.1109/ACCESS.2021.3128742
[3] 谈骏杰,许璟琳,欧金武,等. 基于大模型的建筑智慧运维技术探索与应用[C]//第十届全国BIM学术会议论文集, 北京:中国建筑工业出版社,2024:404-408. [4] 许璟琳,彭 阳,欧金武,等. 融合大模型和数字孪生的公共建筑智慧运维系统[J]. 图学学报,2024,45(6):1200-1206. [5] 吴精乙,景 峻,贺熠凡,等. 基于多模态大模型的高速公路场景交通异常事件分析方法[J]. 图学学报,2024,45(6):1266-1276. [6] 张云秋,殷 策.基于大模型的中文电子病历实体自动识别研究[J/OL].数据分析与知识发现,1-18[2025-03-10]. http://kns.cnki.net/kcms/detail/10.1478.g2.20241118.1735.004.html. [7] International Union of Railways. High-speed around the world[M]. Paris: UIC, 2023: 8-30.
[8] 陈建译. 电务大数据智能运维平台研究与应用[J]. 铁道通信信号,2019,55(S1):162-166. [9] 李凌健. 面向铁路智能运维的大模型技术应用研究[J]. 铁道技术标准(中英文),2025,7(1):70-75. [10] 滕 蕾,张卫军,屈 毅. 铁路通信智能运维方案及演进策略研究[J]. 铁道通信信号,2022,58(11):8-11. [11] Li L F, Guo L. Dynamic low-rank adaptation based pruning algorithm for large language models[C]//2024 7th International Conference on Pattern Recognition and Artificial Intelligence (PRAI), 15-17 August, 2024, Hangzhou, China. New York, USA: IEEE, 2024: 1094-1099.
[12] 姜栋瀚,林海涛. 云计算环境下的资源分配关键技术研究综述[J]. 中国电子科学研究院学报,2018,13(3):308-314. DOI: 10.3969/j.issn.1673-5692.2018.03.013 [13] 李 刚,徐长明,龚 翔,等. 基于掩码自编码器的小样本深度学习道岔故障诊断模型[J]. 中国铁道科学,2022,43(6):175-185. DOI: 10.3969/j.issn.1001-4632.2022.06.18 [14] Fleischer S, Hooke M. Aleatoric and epistemic uncertainty quantification in Bayesian dirichlet cost rules of thumb[C]//2023 IEEE Aerospace Conference, 4-11 March, 2023, Big Sky, USA. New York, USA: IEEE, 2023: 1-8.