Processing math: 77%
  • 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

基于数据挖掘的铁路车站信号平面布置图信息提取

龙芳, 杨扬

龙芳, 杨扬. 基于数据挖掘的铁路车站信号平面布置图信息提取[J]. 铁路计算机应用, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
引用本文: 龙芳, 杨扬. 基于数据挖掘的铁路车站信号平面布置图信息提取[J]. 铁路计算机应用, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
LONG Fang, YANG Yang. Information extraction of railway station signal layout plan based on data mining[J]. Railway Computer Application, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
Citation: LONG Fang, YANG Yang. Information extraction of railway station signal layout plan based on data mining[J]. Railway Computer Application, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01

基于数据挖掘的铁路车站信号平面布置图信息提取

基金项目: 中国铁路总公司科技研究开发计划课题(2017X011-A)
详细信息
    作者简介:

    龙 芳,在读硕士研究生

    杨 扬,副教授

  • 中图分类号: U284.3 : TP39

Information extraction of railway station signal layout plan based on data mining

  • 摘要: 针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RV-DBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法FMI评分0.9860,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。
    Abstract: AAiming at the problem that the data of railway station signal layout plan cannot be reused due to different data formats, this paper presented a data mining based method for extracting information from railway station signal layout plan. The paper constructs the model and code of railway signal engineering legend, and clusters the graphic data into graphic groups based on RV-DBSCAN algorithm, constructed a model through C4.5 decision tree to identify railway signal legend. The test results shows that the FMI score of the clustering method is 0.9860, and the accuracy rate of the classification algorithm is 95.64%. It can accurately identify the legend symbol data in the layout plan, and provides a general data interface for the secondary use of the layout plan information.
  • 城市轨道交通在为居民提供便捷乘车服务的同时也产生了巨大的能源消耗[1]。据统计,牵引能耗为列车运行的主要消耗[2]。荀径对列车节能操纵优化求解方法进行了综述[3];许立、耿晨歌采用遗传算法对列车运行速度曲线生成进行研究,但评价模型过于苛刻[4-5];丁圣采用非支配排序遗传算法研究列车多目标操纵优化,运算复杂度较高[6];刘炜采用时间逼近搜索算法建立节能优化模型,但未考虑舒适度要求[7]。本文根据惰行控制理论[8],建立分段渐进式的评价模型,并将舒适度要求纳入约束条件,采用改进的差分进化(DE,Differential Evolution)算法研究列车节能优化速度曲线的生成,以减少列车牵引能耗。

    城轨列车节能问题本质上是一个多目标优化问题,包含列车准时到达、定点停车和牵引能耗最小的目标。多目标问题求解可将多目标转化为单目标,或是直接采用多目标优化方法。采用Pareto非支配排序方法可对多目标问题进行求解[9],但实验研究表明,仅数代之后,种群中的个体都进化为Pareto非支配个体,此时再将Pareto非支配个体作为最优解的评价标准将失去意义[10]。因此本文采用建立各目标的评价模型,再通过权重分配合成单目标的方法。

    本文采用多质点列车模型,遵循如下假设条件:

    (1)列车为质量分布均匀的刚体,是由足够多数量的质点组成的质点链;

    (2)不考虑车钩间作用力对列车的影响;

    (3)牵引和制动级位各5级。

    在列车运行过程中,作用在列车上的运行方向的力分为3类:牵引力、运行阻力和制动力。

    以列车沿斜坡向上运行为例,如图1所示,其中FBW分别为列车受到的牵引力、制动力、阻力,F与运动方向一致,BW与运动方向相反;N为支持力;G为重力。则列车沿运动方向所受合力Fh为:

    Fh=FWB (1)
    图  1  列车受力分析

    列车牵引力、制动力主要与列车型号、列车运行速度有关。当列车处于牵引状态时,B为0;处于惰行状态时,FB均为0;处于制动状态时,F为0。

    列车运行阻力一般由基本阻力和线路附加阻力组成。基本阻力公式如下:

    w0=a+bv+cv2 (2)

    其中,w0为单位基本阻力;abc为经验常数,v为列车速度。

    线路附加阻力主要包括坡道附加阻力和曲线附加阻力。当单列车厢处于不同的坡道上时,其坡道附加阻力ws为:

    ws=GLsLy11000+GLLsLy21000 (3)

    其中,车厢一长为Ls部分处在千分坡度数为y1的坡道上,车厢另一长为L–Ls部分处在千分坡度数为y2的坡道上;G为该车厢重量。如果单列车厢位于同一坡道,则只需计算该公式的前半部分即可。

    同理,单列车厢位于不同的曲线半径,其曲线附加阻力wr为:

    wr=600R1G1000LrL+600R2G1000LLrL (4)

    其中,车厢一长为Lr部分处在半径为R1的弯曲线路上,车厢另一长为LLr部分处在半径为R2的弯曲线路上。

    将各个车厢所受阻力相加,即为列车受到的总阻力W

    {W=ni=1wsi+wri+w0iF=f_force(v,ws)B=f_brake(v,ws)Fh=FWBA=Fh(1+r)M (5)

    其中,i为车厢号,i=1,···,nn为车厢数;A为列车加速度;r为列车旋转质量系数,M为列车质量;以时间步长0.1 s,得到列车在各时间步长内的参数计算公式。f_force(vws)、f_brake(vws)分别为牵引力、制动力计算函数,与列车速度v和工况状态ws有关。

    牵引能耗是列车运行过程中牵引力做的功,计算公式如下:

    E=niFiΔSi (6)

    其中,n为根据牵引力的改变而划分的区段数;Fi、∆Si分别为第i段的牵引力和牵引力作用的距离;i=1,···,nE为列车牵引力在站间所做的功,即牵引能耗。

    根据惰行控制方式,列车运行由牵引、惰行和制动3种工况组成,工况转换需要满足转换规则才能进行,如表1所示。

    表  1  工况转换规则
    当前工况待转工况
    惰行制动牵引
    惰行——可以可以
    制动可以——禁止
    牵引可以禁止——
    下载: 导出CSV 
    | 显示表格

    DE算法是Rainer Storn等人于1995年提出的一种采用实数编码模拟生物进化的算法,具有高效的全局搜索效果和收敛性能 [10]。但在求解多目标最优化问题时,有易过早收敛、陷入局部最优等问题。本文对现有的DE算法进行改进,根据多目标优化的特点提出了新的交叉策略,提升基于DE进化策略的收敛性能和全局搜索能力。

    改进算法对种群进行约束条件下的初始化,经变异和改进的交叉策略,再通过评价模型得到个体适应值,选出高适应个体组成下一代种群,使种群进化反复循环,直到满足终止准则,则算法结束,如图2所示。

    图  2  改进DE算法流程

    本文采用位置与工况状态值组合的实数编码对个体基因进行设计,位置向量组和工况状态组均包含D个点,起始点位置为0,工况状态为牵引工况,末点位置为目标停车点Se、工况状态为制动工况。种群的个体基因组合GE为:

    {GE=[g1,g2,,gD]gi=si100+wsi (7)

    其中,gi表示第i个点的个体基因,i=1,···,D,由位置si和工况状态值wsi组合而成。

    根据1.2小节的假设条件,牵引和制动级位各5级,如表2所示。其中工况值1 ~ 5分别代表制动输出19%、39%、59%、79%、99%,6 ~ 10分别代表牵引输出19%、39%、59%、79%、99%。

    表  2  工况状态值
    工况惰行制动牵引
    工况值0[1 ~ 5][6 ~ 10]
    下载: 导出CSV 
    | 显示表格

    在种群初始化过程中,生成的个体需要约束,以筛选初始种群,其流程如图3所示。

    图  3  种群初始化流程

    本文以区间限速、最大加速度、最大减速度、运行工况转换原则和牵引制动特性做为约束条件,将舒适度也纳入其中[11],约束条件为:

    {min(qJve+pJE+yJse+(1qpy)Jte)wsRequire=workStatePrncp(workstate)Co=average(6a2t+d2t)s.t{wsRequire=true0 (8)

    其中,JveJseJEJte分别是末速度、末位置、牵引能耗和运行时间评价值;qpy分别是末速度、能耗和末位置评价值所占适应度函数的权重,1–qpy为运行时间评价值的权重,min为所有个体中的最小值;wsRequire为工况评价值,为true表满足工况转换原则;workstate为列车运行工况转换序列;workStatePrncp是工况转换原则判断函数;Co为舒适度评价值,其值小于4时,舒适度满足要求;vtatdtFtBt分别为t时刻列车运行速度、加速度、减速度及受到的牵引力、制动力;Ft,maxBt,maxt时刻可输出的最大牵引力、最大制动力;Vt,max为线路在时刻t的最大允许速度;AmaxDmax为最大允许加速度、最大允许减速度。

    为了保证个体较好的适应性和全局收敛性,结合本文的节能优化模型,基于Matlab进行实验仿真,建立了分段渐进式评价模型,如图4~图7所示。评价模型在形式上保持一致,可有效抑制种群优化趋势向某个目标倾斜,保证种群优化的目标多样性。

    图  4  末速度评价模型
    图  5  牵引能耗评价模型
    图  6  停车位置误差评价模型
    图  7  运行时间误差评价模型

    末速度评价模型对个体的末速度在0 ~ 80 km/h之间进行分段评价,其评价值范围为0 ~ 10 000,末速度超出80 km/h按最高记。牵引能耗评价模型、停车位置误差和运行时间误差评价模型也类似。

    种群终止准则是种群停止进化的一个标准。根据实测数据,如图8所示,在60代以内的收敛幅度较大,60代以后,收敛幅度趋于平缓。故本文设置迭代次数为100,即可达到预期效果。

    图  8  迭代次数与评价值

    改进DE算法包含2个重要参数:缩放因子和交叉概率。

    缩放因子Fs是控制差分矢量对基向量影响大小的参数。本文对Fs的取值进行了测试,Fs为0.5时,收敛效果好,如表3所示。

    表  3  缩放因子对收敛的影响
    缩放因子取值收敛效果
    (0, 0.3]不收敛
    0.4收敛速度慢
    0.5收敛速度快
    [0.6, +∞)不收敛
    下载: 导出CSV 
    | 显示表格

    为进一步增强种群多样性,DE算法交叉目标个体Xk(ts)与变异个体Vk(ts+1),产生候选个体Uk(ts+1),ts代表迭代的代数,k表示第k个个体。

    采用DE算法的交叉策略求解发现,下一代个体中变异个体较少,使算法的收敛效果较差。个体被淘汰的原因有:变异个体的基因值不符合个体基因向量组的要求,交叉概率使一部分个体淘汰。

    为使变异个体有效,对变异策略进行如下改进:

    (1)对变异的无效个体进行有效化处理。

    v_{kj} = v_{kj}\frac{{S_{\rm{e}} \cdot 100 + WS_{\rm{e}}}}{{v_{kD}}},j = 1,2, \cdot \cdot \cdot ,D (9)

    其中,vkjvkD分别为变异个体Vk(ts+1)中的第j维分量和第D维分量,WSe为制动工况值。

    (2)增大交叉概率为1,使收敛效果最好。

    图9为个体末速度生成流程,其他数据生成也类似。

    图  9  个体末速度生成流程

    本文采用文献[7]中提供的上海地铁的线路数据,如表4~表6所示;实现带线路区段限速的列车自动运行(ATO,Automatic Train Operation)曲线生成。列车型号为AC-03,车长144 m,AW2质量327.6 T,牵引特性[8]图10所示。

    表  4  线路坡度
    起点/m终点/m坡度/‰
    02303.1
    2304302.9
    43063030.1
    63088030
    8801 2004.05
    12001 8100
    下载: 导出CSV 
    | 显示表格
    表  5  线路曲线
    起点/m终点/m曲线半径/m
    181373355
    394609350
    8461 341404
    13961 730704
    下载: 导出CSV 
    | 显示表格
    表  6  线路限速
    起点/m终点/m区段限速/km·h-1
    060962
    6091 71075
    17101 81035
    下载: 导出CSV 
    | 显示表格
    图  10  AC03牵引制动特性曲线

    图11可知,随着迭代次数的增加,个体评价值不断减小,个体适应度不断提高,表明算法的收敛效果良好。

    图  11  100代最优个体评价值

    图12是算法生成的最优ATO速度曲线。图13是工况距离曲线,列车在平坡段施加牵引力加速,然后进行缓慢牵引,在上坡段惰行一段时间,最后施加制动减速停车。在满足区间运行时分的前提下,尽可能地利用了线路优势,减少了牵引能耗。其牵引能耗为28.8 kW·h,较文献7节能38%。

    图  12  最优ATO速度曲线
    图  13  工况距离曲线

    本文采用多质点模型分析列车运动情况,基于改进的DE算法,分析线路约束条件,建立评价模型,构建适应度函数,使种群向低能耗、末速度小的方向进行优化。以上海地铁3号线数据为例,经仿真试验,牵引能耗28.8 kW·h,生成的ATO速度曲线,在满足定点准时停车的前提下,达到了节能的目标,证明改进DE算法可用于解决列车节能优化速度曲线问题。但该算法在限速较多的区段,速度曲线计算时间较长,仍需进一步研究和改进。

  • 图  1   车站信号平面布置示意

    图  2   信号图例同构混乱与格式混乱示例

    图  3   车站信号平面布置图数据信息提取流程

    图  4   图例分类组合决策树

    图  5   树节点2-4分类决策树

    图  6   聚类算法图形结果示例

    表  1   信号图例分类与编码

    一级分类二级分类三级分类与编号
    信号机一灯位复示-L:1_1_1复示-B:1_1_2超限绝缘:1_1_3
    二灯位出站-LH:1_2_1预告-LU:1_2_2调车-EB:1_2_3
    表示器-2:1_2_4调车-HB:1_2_5 
    三灯位出站-HLB:1_3_1出站-LHL:1_3_2通过-HLU:1_3_3
    四灯位出站-LHLB:1_4_1出站-LHUB:1_4_2出站-LHUL:1_4_3
    出站-LUHB2调车-EBEB2:1_4_5驼峰-LHUB:1_4_6
    五灯位进站-ULHUB:1_5_1进站-ULHUB:1_5_2出站-LXLHB:1_5_3
    出站-LXLUB:1_5_4出站-LHULB:1_5_5 
    六灯位及以上进站-LUXUHBX2:1_6_1接车进路-XBBUHLU:1_6_2接车进路-XBBLUHLU:1_6_3
    轨道电路及信号固定设备轨道电路设备钢轨绝缘:2_1_1尽头绝缘:2_1_2电气绝缘:2_1_3
    信号固定设备应答器:2_2_1区间信号
    标志牌:2_2_2
     
    站场固定设备道岔及其转换设备尽头线:3_1_1道岔:3_1_2 
    站场固定设施信号楼:3_2_1调车楼:3_2_2警冲标:3_2_3
    下载: 导出CSV

    表  2   图形图元矩形σ邻域

    图元类型矩形σ邻域
    Circle(cx,cy,cr)xmax=cx+cr, xmin=cx-cr,
    ymax=cy+cr, ymin=cy-cr
    Line(x1,y1,x2,y2)xmax=max(x1,x2), xmin=min(x1,x2)
    ymax=max(y1,y2), ymin=min(y1,y2)
    Hatch(edge1,
    edge2,···,htype
    xmax=max(x1,···,xn), xmin=min(x1,···,xn)
    ymax= max(y1,···,yn), xmin=min(y1,···,yn)
    Text(x1,y1,content, fontsize)ymax=x1+len(content)· fontsize,xmin=x1
    ymax=y1+fontsize,ymin=y1
    下载: 导出CSV

    表  3   图形拓扑特征属性

    属性类别属性名称属性备注属性解释
    圆属性BigNum大圆个数图形组中大圆的个数
    HorGap大圆横坐标差比值大圆最远横坐标差值与半径的比值
    VerGap大圆纵坐标差比值大圆最远纵坐标差值与半径的比值
    InSamll大圆内小圆大圆内含的小圆
    OutSmall大圆外小圆大圆外离的小圆
    直线属性InLine1圆内直线1与大圆包含长度≤R
    InLine2圆内直线2与大圆包含长度≤2R
    OutLine1圆外直线1与大圆非包含长度≤R
    OutLine2圆外直线2与大圆非包含长度≤2R
    OutLine3圆外直线3与大圆非包含长度≤3R
    填充属性HatchNum填充数量填充块的数量
    文字属性WordType文字类型图例文字分类
    下载: 导出CSV

    表  4   聚类算法数据结果

     TPFPFNFMI
    DBSCAN15391202250.899634
    OPTICS1666186320.9394759
    CLIQUE172892640.9568393
    RV-DBSCAN183234180.9860155
    下载: 导出CSV

    表  5   分类算法结果

    测试样本总数信号固定设备信号机站场固定设备
    45992107260
    组合
    决策树模型
    正确分类数43986105248
    一级正判率99.35%97.83%100.00%99.62%
    二级正判率96.08%93.48%100.00%95.38%
    三级正判率95.64%93.48%97.22%95.38%
    单决策树模型正确分类数4238298243
    正判率92.16%89.13%90.74%93.46%
    KNN
    模型
    正确分类数3857875232
    正判率83.88%84.78%69.44%89.23%
    SVM
    模型
    正确分类数3987486238
    正判率86.71%80.43%79.63%91.54%
    下载: 导出CSV

    表  6   生成联锁表所需数据格式

    信号设备属性
    信号机类型(列车、调车);种类(进站、出站、单置、并置、差置);坐标;高矮柱;朝向
    道岔类型(单动、双动、渡线);岔尖坐标;岔心坐标;定位坐标、反位坐标
    区段类型(无岔、有岔、股道);左侧坐标;右侧坐标
    其他类型(侵限绝缘、机械绝缘);坐标
    下载: 导出CSV
  • [1] 罗宏伟. 铁路站场设计系统研究与开发 [J]. 铁道标准设计,2018,62(5):37-39,44. DOI: 10.13238/j.issn.1004-2954.201708050002
    [2] 李茂蛟. BIM技术在铁路信号工程设计中的应用研究 [J]. 铁道勘察,2020,46(1):144-149. DOI: 10.19630/j.cnki.tdkc.201909060014
    [3] 陈 刚. 基于三维空间模型的铁路站场平纵横一体化设计软件研究 [J]. 铁路计算机应用,2017,26(10):28-31,48. DOI: 10.3969/j.issn.1005-8451.2017.10.009
    [4] 安春兰. 铁路车站信号平面布置图的计算机辅助设计[D]. 成都: 西南交通大学, 2011.
    [5] 程耀东,潘永健,朱奕蓓,等. 高速铁路综合图自动生成关键技术研究 [J]. 铁道标准设计.,2015,59(10):42-45,53.
    [6] 付 强,袁 磊. 基于聚类分析及SVM的DMI机车信号自动识别 [J]. 铁路计算机应用,2015,24(8):46-49. DOI: 10.3969/j.issn.1005-8451.2015.08.013
    [7] 黄孝章,刘双双. 铁路站场平面图CAD系统中图形信息的自动识别和提取方法 [J]. 交通与计算机,1998,16(2):53-57.
    [8] 张天祖,吕兴寿. 铁路站场平面图中主要元素的自动识别算法 [J]. 兰州交通大学学报,2013,32(3):124-127,163. DOI: 10.3969/j.issn.1001-4373.2013.04.027
    [9] 王 飞. 基于图像处理和神经网络的站场状态信息识别方法 [J]. 铁道通信信号,2021,57(3):60-63. DOI: 10.13879/j.issn.1000-7458.2021-03.20513
    [10]

    Lu Q C, Chen L, Li S, et al. Semi-automatic geometric digital twinning for existing buildings based on images and CAD drawings [J]. Automation in Construction, 2020(115): 103183. DOI: 10.1016/j.autcon.2020.103183

    [11]

    Scheibel B, Mangler J, Rinderle-Ma S. Extraction of dimension requirements from engineering drawings for supporting quality control in production processes [J]. Computers in Industry, 2021, 129: 103442. DOI: 10.1016/j.compind.2021.103442

    [12]

    Wen R, Tang W Q, Su Z Y. Topology based 2D engineering drawing and 3D model matching for process plant [J]. Graphical Models, 2017(92): 1-15. DOI: 10.1016/j.gmod.2017.06.001

    [13] 李 锐. DXF建筑工程图的读取、识别与三维重建[D]. 天津: 天津大学, 2017.
    [14] 国家铁路局. 铁路工程制图图形符号标准: TB/T 10059-2015[S]. 北京: 中国铁道出版社, 2015.
    [15]

    Angelini P, Frati F, Kaufmann K. Straight-line rectangular drawings of clustered graphs [J]. Discrete & Computational Geometry, 2011, 45(1): 88-140.

    [16] 朱文博,王小敏. 基于组合决策树的无绝缘轨道电路故障诊断方法研究 [J]. 铁道学报,2018,40(7):74-79. DOI: 10.3969/j.issn.1001-8360.2018.07.011
  • 期刊类型引用(3)

    1. 张晓冬. 基于VR技术的铁路调车作业安全仿真系统研究. 铁道货运. 2024(04): 32-37+45 . 百度学术
    2. 刘祯祥,党建武,王阳萍,岳彪,王文润. 铁路机车车载设备数字孪生体构建方法研究. 铁道通信信号. 2023(03): 8-13 . 百度学术
    3. 张晓梅 ,鲁工圆 ,彭其渊 ,李力 ,何必胜 . 大型编组站作业仿真实验平台建设与实验教学. 实验科学与技术. 2023(03): 29-35 . 百度学术

    其他类型引用(1)

图(6)  /  表(6)
计量
  • 文章访问数:  166
  • HTML全文浏览量:  114
  • PDF下载量:  60
  • 被引次数: 4
出版历程
  • 收稿日期:  2022-05-29
  • 刊出日期:  2022-12-29

目录

/

返回文章
返回