Information extraction of railway station signal layout plan based on data mining
-
摘要: 针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RV-DBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法FMI评分0.9860,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。Abstract: AAiming at the problem that the data of railway station signal layout plan cannot be reused due to different data formats, this paper presented a data mining based method for extracting information from railway station signal layout plan. The paper constructs the model and code of railway signal engineering legend, and clusters the graphic data into graphic groups based on RV-DBSCAN algorithm, constructed a model through C4.5 decision tree to identify railway signal legend. The test results shows that the FMI score of the clustering method is 0.9860, and the accuracy rate of the classification algorithm is 95.64%. It can accurately identify the legend symbol data in the layout plan, and provides a general data interface for the secondary use of the layout plan information.
-
城市轨道交通在为居民提供便捷乘车服务的同时也产生了巨大的能源消耗[1]。据统计,牵引能耗为列车运行的主要消耗[2]。荀径对列车节能操纵优化求解方法进行了综述[3];许立、耿晨歌采用遗传算法对列车运行速度曲线生成进行研究,但评价模型过于苛刻[4-5];丁圣采用非支配排序遗传算法研究列车多目标操纵优化,运算复杂度较高[6];刘炜采用时间逼近搜索算法建立节能优化模型,但未考虑舒适度要求[7]。本文根据惰行控制理论[8],建立分段渐进式的评价模型,并将舒适度要求纳入约束条件,采用改进的差分进化(DE,Differential Evolution)算法研究列车节能优化速度曲线的生成,以减少列车牵引能耗。
1 问题分析与模型构建
1.1 问题分析
城轨列车节能问题本质上是一个多目标优化问题,包含列车准时到达、定点停车和牵引能耗最小的目标。多目标问题求解可将多目标转化为单目标,或是直接采用多目标优化方法。采用Pareto非支配排序方法可对多目标问题进行求解[9],但实验研究表明,仅数代之后,种群中的个体都进化为Pareto非支配个体,此时再将Pareto非支配个体作为最优解的评价标准将失去意义[10]。因此本文采用建立各目标的评价模型,再通过权重分配合成单目标的方法。
1.2 力学模型与能耗计算
本文采用多质点列车模型,遵循如下假设条件:
(1)列车为质量分布均匀的刚体,是由足够多数量的质点组成的质点链;
(2)不考虑车钩间作用力对列车的影响;
(3)牵引和制动级位各5级。
在列车运行过程中,作用在列车上的运行方向的力分为3类:牵引力、运行阻力和制动力。
以列车沿斜坡向上运行为例,如图1所示,其中F、B、W分别为列车受到的牵引力、制动力、阻力,F与运动方向一致,B、W与运动方向相反;N为支持力;G为重力。则列车沿运动方向所受合力Fh为:
Fh=F−W−B (1) 列车牵引力、制动力主要与列车型号、列车运行速度有关。当列车处于牵引状态时,B为0;处于惰行状态时,F和B均为0;处于制动状态时,F为0。
列车运行阻力一般由基本阻力和线路附加阻力组成。基本阻力公式如下:
w0=a+bv+cv2 (2) 其中,w0为单位基本阻力;a、b、c为经验常数,v为列车速度。
线路附加阻力主要包括坡道附加阻力和曲线附加阻力。当单列车厢处于不同的坡道上时,其坡道附加阻力ws为:
ws=G⋅LsL⋅y11000+G⋅L−LsL⋅y21000 (3) 其中,车厢一长为Ls部分处在千分坡度数为y1的坡道上,车厢另一长为L–Ls部分处在千分坡度数为y2的坡道上;G为该车厢重量。如果单列车厢位于同一坡道,则只需计算该公式的前半部分即可。
同理,单列车厢位于不同的曲线半径,其曲线附加阻力wr为:
wr=600R1⋅G1000⋅LrL+600R2⋅G1000⋅L−LrL (4) 其中,车厢一长为Lr部分处在半径为R1的弯曲线路上,车厢另一长为L–Lr部分处在半径为R2的弯曲线路上。
将各个车厢所受阻力相加,即为列车受到的总阻力W。
{W=n∑i=1wsi+wri+w0iF=f_force(v,ws)B=f_brake(v,ws)Fh=F−W−BA=Fh(1+r)M (5) 其中,i为车厢号,i=1,···,n,n为车厢数;A为列车加速度;r为列车旋转质量系数,M为列车质量;以时间步长0.1 s,得到列车在各时间步长内的参数计算公式。f_force(v,ws)、f_brake(v,ws)分别为牵引力、制动力计算函数,与列车速度v和工况状态ws有关。
牵引能耗是列车运行过程中牵引力做的功,计算公式如下:
E=n∑iFi⋅ΔSi (6) 其中,n为根据牵引力的改变而划分的区段数;Fi、∆Si分别为第i段的牵引力和牵引力作用的距离;i=1,···,n;E为列车牵引力在站间所做的功,即牵引能耗。
1.3 列车运行工况转换原则
根据惰行控制方式,列车运行由牵引、惰行和制动3种工况组成,工况转换需要满足转换规则才能进行,如表1所示。
表 1 工况转换规则当前工况 待转工况 惰行 制动 牵引 惰行 —— 可以 可以 制动 可以 —— 禁止 牵引 可以 禁止 —— 2 改进DE算法
DE算法是Rainer Storn等人于1995年提出的一种采用实数编码模拟生物进化的算法,具有高效的全局搜索效果和收敛性能 [10]。但在求解多目标最优化问题时,有易过早收敛、陷入局部最优等问题。本文对现有的DE算法进行改进,根据多目标优化的特点提出了新的交叉策略,提升基于DE进化策略的收敛性能和全局搜索能力。
改进算法对种群进行约束条件下的初始化,经变异和改进的交叉策略,再通过评价模型得到个体适应值,选出高适应个体组成下一代种群,使种群进化反复循环,直到满足终止准则,则算法结束,如图2所示。
2.1 个体基因设计与初始化种群
本文采用位置与工况状态值组合的实数编码对个体基因进行设计,位置向量组和工况状态组均包含D个点,起始点位置为0,工况状态为牵引工况,末点位置为目标停车点Se、工况状态为制动工况。种群的个体基因组合GE为:
{GE=[g1,g2,⋅⋅⋅,gD]gi=si⋅100+wsi (7) 其中,gi表示第i个点的个体基因,i=1,···,D,由位置si和工况状态值wsi组合而成。
根据1.2小节的假设条件,牵引和制动级位各5级,如表2所示。其中工况值1 ~ 5分别代表制动输出19%、39%、59%、79%、99%,6 ~ 10分别代表牵引输出19%、39%、59%、79%、99%。
表 2 工况状态值工况 惰行 制动 牵引 工况值 0 [1 ~ 5] [6 ~ 10] 在种群初始化过程中,生成的个体需要约束,以筛选初始种群,其流程如图3所示。
2.2 约束条件分析
本文以区间限速、最大加速度、最大减速度、运行工况转换原则和牵引制动特性做为约束条件,将舒适度也纳入其中[11],约束条件为:
{min(q⋅Jve+p⋅JE+y⋅Jse+(1−q−p−y)⋅Jte)wsRequire=workStatePrncp(workstate)Co=average(6⋅√a2t+d2t)s.t{wsRequire=true0⩽ (8) 其中,Jve、Jse、JE和Jte分别是末速度、末位置、牵引能耗和运行时间评价值;q、p、y分别是末速度、能耗和末位置评价值所占适应度函数的权重,1–q–p–y为运行时间评价值的权重,min为所有个体中的最小值;wsRequire为工况评价值,为true表满足工况转换原则;workstate为列车运行工况转换序列;workStatePrncp是工况转换原则判断函数;Co为舒适度评价值,其值小于4时,舒适度满足要求;vt、at、dt、Ft、Bt分别为t时刻列车运行速度、加速度、减速度及受到的牵引力、制动力;Ft,max、Bt,max为t时刻可输出的最大牵引力、最大制动力;Vt,max为线路在时刻t的最大允许速度;Amax、Dmax为最大允许加速度、最大允许减速度。
2.3 目标评价模型与终止准则
为了保证个体较好的适应性和全局收敛性,结合本文的节能优化模型,基于Matlab进行实验仿真,建立了分段渐进式评价模型,如图4~图7所示。评价模型在形式上保持一致,可有效抑制种群优化趋势向某个目标倾斜,保证种群优化的目标多样性。
末速度评价模型对个体的末速度在0 ~ 80 km/h之间进行分段评价,其评价值范围为0 ~ 10 000,末速度超出80 km/h按最高记。牵引能耗评价模型、停车位置误差和运行时间误差评价模型也类似。
种群终止准则是种群停止进化的一个标准。根据实测数据,如图8所示,在60代以内的收敛幅度较大,60代以后,收敛幅度趋于平缓。故本文设置迭代次数为100,即可达到预期效果。
3 算法参数设计与中间参数生成
改进DE算法包含2个重要参数:缩放因子和交叉概率。
3.1 缩放因子
缩放因子Fs是控制差分矢量对基向量影响大小的参数。本文对Fs的取值进行了测试,Fs为0.5时,收敛效果好,如表3所示。
表 3 缩放因子对收敛的影响缩放因子取值 收敛效果 (0, 0.3] 不收敛 0.4 收敛速度慢 0.5 收敛速度快 [0.6, +∞) 不收敛 3.2 交叉策略的改进
为进一步增强种群多样性,DE算法交叉目标个体Xk(ts)与变异个体Vk(ts+1),产生候选个体Uk(ts+1),ts代表迭代的代数,k表示第k个个体。
采用DE算法的交叉策略求解发现,下一代个体中变异个体较少,使算法的收敛效果较差。个体被淘汰的原因有:变异个体的基因值不符合个体基因向量组的要求,交叉概率使一部分个体淘汰。
为使变异个体有效,对变异策略进行如下改进:
(1)对变异的无效个体进行有效化处理。
v_{kj} = v_{kj}\frac{{S_{\rm{e}} \cdot 100 + WS_{\rm{e}}}}{{v_{kD}}},j = 1,2, \cdot \cdot \cdot ,D (9) 其中,vkj和vkD分别为变异个体Vk(ts+1)中的第j维分量和第D维分量,WSe为制动工况值。
(2)增大交叉概率为1,使收敛效果最好。
3.3 中间数据生成
图9为个体末速度生成流程,其他数据生成也类似。
4 算例分析
本文采用文献[7]中提供的上海地铁的线路数据,如表4~表6所示;实现带线路区段限速的列车自动运行(ATO,Automatic Train Operation)曲线生成。列车型号为AC-03,车长144 m,AW2质量327.6 T,牵引特性[8]如图10所示。
表 4 线路坡度起点/m 终点/m 坡度/‰ 0 230 3.1 230 430 2.9 430 630 30.1 630 880 30 880 1 200 4.05 1200 1 810 0 表 5 线路曲线起点/m 终点/m 曲线半径/m 181 373 355 394 609 350 846 1 341 404 1396 1 730 704 表 6 线路限速起点/m 终点/m 区段限速/km·h-1 0 609 62 609 1 710 75 1710 1 810 35 如图11可知,随着迭代次数的增加,个体评价值不断减小,个体适应度不断提高,表明算法的收敛效果良好。
图12是算法生成的最优ATO速度曲线。图13是工况距离曲线,列车在平坡段施加牵引力加速,然后进行缓慢牵引,在上坡段惰行一段时间,最后施加制动减速停车。在满足区间运行时分的前提下,尽可能地利用了线路优势,减少了牵引能耗。其牵引能耗为28.8 kW·h,较文献7节能38%。
5 结束语
本文采用多质点模型分析列车运动情况,基于改进的DE算法,分析线路约束条件,建立评价模型,构建适应度函数,使种群向低能耗、末速度小的方向进行优化。以上海地铁3号线数据为例,经仿真试验,牵引能耗28.8 kW·h,生成的ATO速度曲线,在满足定点准时停车的前提下,达到了节能的目标,证明改进DE算法可用于解决列车节能优化速度曲线问题。但该算法在限速较多的区段,速度曲线计算时间较长,仍需进一步研究和改进。
-
表 1 信号图例分类与编码
一级分类 二级分类 三级分类与编号 信号机 一灯位 复示-L:1_1_1 复示-B:1_1_2 超限绝缘:1_1_3 二灯位 出站-LH:1_2_1 预告-LU:1_2_2 调车-EB:1_2_3 表示器-2:1_2_4 调车-HB:1_2_5 三灯位 出站-HLB:1_3_1 出站-LHL:1_3_2 通过-HLU:1_3_3 四灯位 出站-LHLB:1_4_1 出站-LHUB:1_4_2 出站-LHUL:1_4_3 出站-LUHB2 调车-EBEB2:1_4_5 驼峰-LHUB:1_4_6 五灯位 进站-ULHUB:1_5_1 进站-ULHUB:1_5_2 出站-LXLHB:1_5_3 出站-LXLUB:1_5_4 出站-LHULB:1_5_5 六灯位及以上 进站-LUXUHBX2:1_6_1 接车进路-XBBUHLU:1_6_2 接车进路-XBBLUHLU:1_6_3 轨道电路及信号固定设备 轨道电路设备 钢轨绝缘:2_1_1 尽头绝缘:2_1_2 电气绝缘:2_1_3 信号固定设备 应答器:2_2_1 区间信号
标志牌:2_2_2站场固定设备 道岔及其转换设备 尽头线:3_1_1 道岔:3_1_2 站场固定设施 信号楼:3_2_1 调车楼:3_2_2 警冲标:3_2_3 表 2 图形图元矩形σ邻域
图元类型 矩形σ邻域 Circle(cx,cy,cr) xmax=cx+cr, xmin=cx-cr,
ymax=cy+cr, ymin=cy-crLine(x1,y1,x2,y2) x max=max(x1,x2), xmin=min(x1,x2)
ymax=max(y1,y2) , ymin=min(y1,y2) Hatch(edge1,
edge2,···,htype)xmax=max(x1,···,xn), xmin=min(x1,···,xn)
ymax= max(y1,···,yn), xmin=min(y1,···,yn)Text(x1,y1,content, fontsize) ymax=x1+len(content)· fontsize,xmin=x1
ymax=y1+fontsize,ymin=y1表 3 图形拓扑特征属性
属性类别 属性名称 属性备注 属性解释 圆属性 BigNum 大圆个数 图形组中大圆的个数 HorGap 大圆横坐标差比值 大圆最远横坐标差值与半径的比值 VerGap 大圆纵坐标差比值 大圆最远纵坐标差值与半径的比值 InSamll 大圆内小圆 大圆内含的小圆 OutSmall 大圆外小圆 大圆外离的小圆 直线属性 InLine1 圆内直线1 与大圆包含长度≤R InLine2 圆内直线2 与大圆包含长度≤2R OutLine1 圆外直线1 与大圆非包含长度≤R OutLine2 圆外直线2 与大圆非包含长度≤2R OutLine3 圆外直线3 与大圆非包含长度≤3R 填充属性 HatchNum 填充数量 填充块的数量 文字属性 WordType 文字类型 图例文字分类 表 4 聚类算法数据结果
TP FP FN FMI DBSCAN 1539 120 225 0.899634 OPTICS 1666 186 32 0.9394759 CLIQUE 1728 92 64 0.9568393 RV-DBSCAN 1832 34 18 0.9860155 表 5 分类算法结果
测试样本总数 信号固定设备 信号机 站场固定设备 459 92 107 260 组合
决策树模型正确分类数 439 86 105 248 一级正判率 99.35% 97.83% 100.00% 99.62% 二级正判率 96.08% 93.48% 100.00% 95.38% 三级正判率 95.64% 93.48% 97.22% 95.38% 单决策树模型 正确分类数 423 82 98 243 正判率 92.16% 89.13% 90.74% 93.46% KNN
模型正确分类数 385 78 75 232 正判率 83.88% 84.78% 69.44% 89.23% SVM
模型正确分类数 398 74 86 238 正判率 86.71% 80.43% 79.63% 91.54% 表 6 生成联锁表所需数据格式
信号设备 属性 信号机 类型(列车、调车);种类(进站、出站、单置、并置、差置);坐标;高矮柱;朝向 道岔 类型(单动、双动、渡线);岔尖坐标;岔心坐标;定位坐标、反位坐标 区段 类型(无岔、有岔、股道);左侧坐标;右侧坐标 其他 类型(侵限绝缘、机械绝缘);坐标 -
[1] 罗宏伟. 铁路站场设计系统研究与开发 [J]. 铁道标准设计,2018,62(5):37-39,44. DOI: 10.13238/j.issn.1004-2954.201708050002 [2] 李茂蛟. BIM技术在铁路信号工程设计中的应用研究 [J]. 铁道勘察,2020,46(1):144-149. DOI: 10.19630/j.cnki.tdkc.201909060014 [3] 陈 刚. 基于三维空间模型的铁路站场平纵横一体化设计软件研究 [J]. 铁路计算机应用,2017,26(10):28-31,48. DOI: 10.3969/j.issn.1005-8451.2017.10.009 [4] 安春兰. 铁路车站信号平面布置图的计算机辅助设计[D]. 成都: 西南交通大学, 2011. [5] 程耀东,潘永健,朱奕蓓,等. 高速铁路综合图自动生成关键技术研究 [J]. 铁道标准设计.,2015,59(10):42-45,53. [6] 付 强,袁 磊. 基于聚类分析及SVM的DMI机车信号自动识别 [J]. 铁路计算机应用,2015,24(8):46-49. DOI: 10.3969/j.issn.1005-8451.2015.08.013 [7] 黄孝章,刘双双. 铁路站场平面图CAD系统中图形信息的自动识别和提取方法 [J]. 交通与计算机,1998,16(2):53-57. [8] 张天祖,吕兴寿. 铁路站场平面图中主要元素的自动识别算法 [J]. 兰州交通大学学报,2013,32(3):124-127,163. DOI: 10.3969/j.issn.1001-4373.2013.04.027 [9] 王 飞. 基于图像处理和神经网络的站场状态信息识别方法 [J]. 铁道通信信号,2021,57(3):60-63. DOI: 10.13879/j.issn.1000-7458.2021-03.20513 [10] Lu Q C, Chen L, Li S, et al. Semi-automatic geometric digital twinning for existing buildings based on images and CAD drawings [J]. Automation in Construction, 2020(115): 103183. DOI: 10.1016/j.autcon.2020.103183
[11] Scheibel B, Mangler J, Rinderle-Ma S. Extraction of dimension requirements from engineering drawings for supporting quality control in production processes [J]. Computers in Industry, 2021, 129: 103442. DOI: 10.1016/j.compind.2021.103442
[12] Wen R, Tang W Q, Su Z Y. Topology based 2D engineering drawing and 3D model matching for process plant [J]. Graphical Models, 2017(92): 1-15. DOI: 10.1016/j.gmod.2017.06.001
[13] 李 锐. DXF建筑工程图的读取、识别与三维重建[D]. 天津: 天津大学, 2017. [14] 国家铁路局. 铁路工程制图图形符号标准: TB/T 10059-2015[S]. 北京: 中国铁道出版社, 2015. [15] Angelini P, Frati F, Kaufmann K. Straight-line rectangular drawings of clustered graphs [J]. Discrete & Computational Geometry, 2011, 45(1): 88-140.
[16] 朱文博,王小敏. 基于组合决策树的无绝缘轨道电路故障诊断方法研究 [J]. 铁道学报,2018,40(7):74-79. DOI: 10.3969/j.issn.1001-8360.2018.07.011 -
期刊类型引用(3)
1. 张晓冬. 基于VR技术的铁路调车作业安全仿真系统研究. 铁道货运. 2024(04): 32-37+45 . 百度学术
2. 刘祯祥,党建武,王阳萍,岳彪,王文润. 铁路机车车载设备数字孪生体构建方法研究. 铁道通信信号. 2023(03): 8-13 . 百度学术
3. 张晓梅 ,鲁工圆 ,彭其渊 ,李力 ,何必胜 . 大型编组站作业仿真实验平台建设与实验教学. 实验科学与技术. 2023(03): 29-35 . 百度学术
其他类型引用(1)