Information extraction of railway station signal layout plan based on data mining
-
摘要: 针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RV-DBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法FMI评分0.9860,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。Abstract: AAiming at the problem that the data of railway station signal layout plan cannot be reused due to different data formats, this paper presented a data mining based method for extracting information from railway station signal layout plan. The paper constructs the model and code of railway signal engineering legend, and clusters the graphic data into graphic groups based on RV-DBSCAN algorithm, constructed a model through C4.5 decision tree to identify railway signal legend. The test results shows that the FMI score of the clustering method is 0.9860, and the accuracy rate of the classification algorithm is 95.64%. It can accurately identify the legend symbol data in the layout plan, and provides a general data interface for the secondary use of the layout plan information.
-
我国铁路货运规模庞大,2019年,中欧班列全年开行8225列,同比增长29%,发送货物72.5万标箱,同比增长34%[1]。在“公转铁”、“一带一路”的大背景下,铁路货运加快多样化转型,提升服务质量,但仍存在数字业务效率低、货踪不透明、物流企业融资困难、缺乏信息服务等问题。
区块链技术具有去中心化、开放、可追溯、不可篡改等特点,能够加强多系统间的数据融合,促进协作。在铁路货运领域,李平等人分析区块链技术国内外应用情况,提出了铁路大数据共享、“一带一路”铁路货运物流等场景[2]。本文讨论了铁路货运中区块链应用的关键技术和主要应用场景,以供参考。
1 区块链技术概述
区块链可以看作一种不可篡改的分布式数据库。利用分布式技术,区块链网络中的每个成员存储着一致的账本,账本的信息打包储存在数据区块中。如图1所示,区块和区块间以时间为序,组成链式结构,利用密码学技术首尾连接在一起,每个区块中包含的信息可以是事件的细节、价值交易、自动化操作或其他信息。
区块链适合于内在分散、孤立的行业。铁路货运涉及多方密切协作,是区块链典型的应用场景。区块链应用在货运领域的探索可以追溯至2015年前后,目前应用研究较少,主要针对流程优化、物流追踪、物流金融等方向,具体包括结算对账、商品溯源、冷链运输、电子发票等领域。
2 铁路货运中区块链应用的关键技术
2.1 联盟链网络
按照网络部署方式的不同,区块链可以分为公有链、联盟链和私有链。公有链是完全去中心化的结构,通常用于开放的共享记账系统;联盟链是部分中心化的分布式结构,由参与联盟的多个机构形成多中心,通常用于行业间地位相对对等的组织团体共享数据;私有链是机构内部形成的中心化结构,通常用于企业内部的控制和审计[3]。3种区块链的对比如表1所示。
表 1 3种类型区块链对比对比项 公有链 联盟链 私有链 中心化程度 无中心 部分中心 可信中心 节点规模 无限制 有限规模 有限规模 加入机制 随时进出 预定义的参与方 限内部节点 数据容错性 高 适中 低 交易效率 低 适中 高 数据隐私 加密,完全
公开联盟内部共享,
有一定隔离机制只对单一组织开放,
隐私更强铁路货运区块链网络出于业务和监管的考量,需要一定程度的中心化。因此,铁路货运区块链架构设计应选择架构更为灵活的联盟链,并采取部分私有的方式。比如区块链节点以铁路货运公司为主,相关业务方可以选择加入区块链节点,如图2(a)所示,或者通过网络访问区块链中的节点,如图2(b)所示。
铁路货运区块链网络建设初期,应该遵循最小业务原则,为一部分简单的业务建立数据模型和业务逻辑,组建小型的区块链网络。随着铁路公司与不同主体的业务增加,区块链网络节点可以随之拓展,若干区块链网络之间再构成更大范围的区块链,将不同分区的业务数据汇聚起来,兼容了分散化和中心化。
2.2 跨链技术
因为整个区块链网络是分区的,数据集成时必然面临两个问题:信息孤岛和区块链异构。异构区块链间数据结构、接口协议的不同会导致交易合法性证明各不相同,加剧信息孤岛。跨链技术通过连接互相独立的区块链系统,实现不同链上资产和数据的互操作,从而解决孤岛问题。
常见的跨链技术实现方式包括公证人机制、哈希锁定和侧链/中继技术[4]。公证人机制需要一个或一组节点在两条链间作为公证人,进行双方交易的收集和验证,架构简单,但引入了一定的中心化;哈希锁定利用了哈希锁和时间锁,能够确保交换的原子性和真实性,但哈希锁定只能用于交换,且增加了交易次数,目前只适合资产交易场景;侧链/中继链技术通过双向锚定的方式实现资产在不同链之间的转移,中继链可以看作去中心的公证人机制,不同的链之间都可以在中继链上进行跨链交互。
铁路货运中不同业务链涉及跨链通信时,要考虑具体场景的连接方式、信息传输渠道、验证机制和消息反馈机制。如集装箱公司和供应商之间存在对账结算链,集装箱公司和金融机构间存在贷款融资链,通过中继链互认、互操作即可完成可靠的信息流转。运输中涉及多种物联网设备,硬件模块的选择和组合具有多样性,对区块链平台的支持能力各不相同,且部署完成后难以更新,而跨链技术可较好的满足物联网设备在多样化场景中的需求。
2.3 物联网终端接入
物联网终端是铁路货运里的重要一环。在区块链中,必须保证数据源头可信。在货运过程中,可基于智能设施和物联网完成数据的自动采集、存储和传递,尽可能排除人为干扰。物联网的智能识别技术主要包括条形码/二维码识别技术、射频识别技术、GPS技术、信息物理系统(CPS,Cyber-Physical Systems)技术等。
针对如何将物联网设备与区块链集成,各行业研究者们提出了较多方案[5]:Xie等人设计了基于区块链和传感器网络的农产品溯源系统[6],传感器网络收集并上传GPS、压力、加速度、温度、湿度模块的数据,封装后储存进区块链,供应用层访问;Bocek等人搭建了一个基于区块链的系统架构[7],监控药品在运输过程中的温度,确保药品质量,其架构包含前端、后端、物联网传感设备,前端用于接收传感器数据并与后端服务器交换JSON格式的数据。
在铁路货运中,物联网终端与区块链网络融合可用于车号/箱号识别、运输状态监测,可提供准确、可靠的产品信息和物流信息。将其与区块链中可信的数据溯源结合,可以确保货运信息在收集、传递和共享的过程中真实、完整。
2.4 智能合约
智能合约是区块链网络中承载数据和业务的部分,根据具体的业务,定义数据模型和功能接口,供上层功能调用。存储在区块链节点的数据,在读写时都需要通过节点上的智能合约。创建好的智能合约需要被安装在区块链节点上,合约每一次改动后都需要被重新部署,并在区块链上留下可溯源的记录,以此确保链上的每一个节点都认同新的合约规则。
铁路货运中,智能合约是业务落地的关键点,通过智能合约可以灵活地实现设备管理、访问控制、产品溯源等应用功能。刘昱刚等针对多式联运电子提单业务提出基于区块链技术的电子提单流转平台[8],将提单作为托运人、多式联运、海关、商检、金融机构之间的流转物,在线完成电子提单的签发、转让、付款、货物检查等事件。
3 铁路货运中区块链的应用场景
3.1 物流追踪
终端消费者需要了解铁路货运的产品物流信息,从而加强对此次消费的信任;上游供应方由于铁路运输时延较长,掌握物流信息能更好地预测市场;承运方掌握详细的信息更有助于了解运输中上下游的情况。
区块链与物联网的组合,对所运输货物的物权、数量、质量、状态等证明文件的真实性、可靠性和有效性意义重大。企业可利用区块链技术,打造铁路货运存证平台,实现对运输过程中产生的各种证明、货物状态等的记录和查询,确保信息的真实、可靠和有效。
3.2 流程优化
与公路和飞机相比,铁路运输周期较长,流程复杂,涉及相关方较多。如果能实现单证电子化,提高作业过程信息化程度,就能减少信息孤岛,提高信息时效,有利于解决各方痛点,提升铁路货运整体运作效率,降低运营成本。
结算双方企业需要通过系统接口对接的方式完成不同阶段数据的共享与流通,信用签收依赖纸质运单,双方各有一套清结算数据,结算双方每个结算周期要进行对账,需要人工审核大量的纸质单据,有成本高、效率低,结算周期长的问题。通过引入区块链技术,可形成具有不可篡改性的账单记录。以此账单作为物流企业与上游客户以及下游供应商之间的财务对账依据,可以实现交易即清算。同时将包含运价规则的电子合同写入区块链,使结算双方共享同一份双方认可的交易数据和运价规则,保障计费后对账单的一致性。如果对账过程中存在异常账单,可以进行调账,将调账的审核过程和结算付款发票信息作为存证写入区块链,从而降低对账成本,减少贸易摩擦。
3.3 抵押融资
铁路货运周期一般为7~14天,货物价值高,资金回收可靠,较适合做抵押贷款。但传统的仓单质押业务存在银行对仓单信息获取不及时的问题,使得银行难以对贷款风险进行评估,导致企业融资困难。
区块链技术可用来划定运输中货物的权属,使货物价值在各个实体间传递,从而分离大宗集体资产的所有权、使用权、交易权、收益权,同时促进动产质押业务从现有的自发、自主描述化的模式向系统确认的模式转变,发挥资产的流动性价值。
3.4 铁路物流企业征信
我国货运物流长期以来有“多、小、散、乱”的特点,信息不对称、不完整。众多经营主体缺乏有效的组织和管理,经营行为不规范,制约行业发展。
通过区块链、大数据等技术,根据铁路货运相关企业交易信息,研究企业信用评级模型,可以围绕铁路企业建立信用评价机制,加强信用记录信息共享,对违法失信行为进行预警和披露。进而整合铁路供应链涉及的市场准入、海关、质检等环节,健全铁路货运市场诚信体系。
4 结束语
本文分析了区块链技术在铁路货运中应用的关键技术及应用场景。目前,区块链技术在铁路货运中的研究尚处在起步阶段,应用的过程中还存在一些难题,距离产业化还有较大距离。区块链技术在铁路货运领域的落地不仅仅是技术问题,而是如何在铁路内外的众多企业、组织中克服协作壁垒,构建信任网络的问题。
下一步,还需努力推动区块链技术在铁路集装箱运输、铁路快运对账、铁路物流金融、海关存证、物流企业征信等场景的示范项目。针对不同场景,寻求共识协议、跨链通信、加密算法等关键技术的适配和改进,提高区块链系统在铁路货运业务中的可用性、可扩展性、吞吐量、安全性,探索更有前景和活力的应用模式。
-
表 1 信号图例分类与编码
一级分类 二级分类 三级分类与编号 信号机 一灯位 复示-L:1_1_1 复示-B:1_1_2 超限绝缘:1_1_3 二灯位 出站-LH:1_2_1 预告-LU:1_2_2 调车-EB:1_2_3 表示器-2:1_2_4 调车-HB:1_2_5 三灯位 出站-HLB:1_3_1 出站-LHL:1_3_2 通过-HLU:1_3_3 四灯位 出站-LHLB:1_4_1 出站-LHUB:1_4_2 出站-LHUL:1_4_3 出站-LUHB2 调车-EBEB2:1_4_5 驼峰-LHUB:1_4_6 五灯位 进站-ULHUB:1_5_1 进站-ULHUB:1_5_2 出站-LXLHB:1_5_3 出站-LXLUB:1_5_4 出站-LHULB:1_5_5 六灯位及以上 进站-LUXUHBX2:1_6_1 接车进路-XBBUHLU:1_6_2 接车进路-XBBLUHLU:1_6_3 轨道电路及信号固定设备 轨道电路设备 钢轨绝缘:2_1_1 尽头绝缘:2_1_2 电气绝缘:2_1_3 信号固定设备 应答器:2_2_1 区间信号
标志牌:2_2_2站场固定设备 道岔及其转换设备 尽头线:3_1_1 道岔:3_1_2 站场固定设施 信号楼:3_2_1 调车楼:3_2_2 警冲标:3_2_3 表 2 图形图元矩形σ邻域
图元类型 矩形σ邻域 Circle(cx,cy,cr) xmax=cx+cr, xmin=cx-cr,
ymax=cy+cr, ymin=cy-crLine(x1,y1,x2,y2) x max=max(x1,x2), xmin=min(x1,x2)
ymax=max(y1,y2) , ymin=min(y1,y2) Hatch(edge1,
edge2,···,htype)xmax=max(x1,···,xn), xmin=min(x1,···,xn)
ymax= max(y1,···,yn), xmin=min(y1,···,yn)Text(x1,y1,content, fontsize) ymax=x1+len(content)· fontsize,xmin=x1
ymax=y1+fontsize,ymin=y1表 3 图形拓扑特征属性
属性类别 属性名称 属性备注 属性解释 圆属性 BigNum 大圆个数 图形组中大圆的个数 HorGap 大圆横坐标差比值 大圆最远横坐标差值与半径的比值 VerGap 大圆纵坐标差比值 大圆最远纵坐标差值与半径的比值 InSamll 大圆内小圆 大圆内含的小圆 OutSmall 大圆外小圆 大圆外离的小圆 直线属性 InLine1 圆内直线1 与大圆包含长度≤R InLine2 圆内直线2 与大圆包含长度≤2R OutLine1 圆外直线1 与大圆非包含长度≤R OutLine2 圆外直线2 与大圆非包含长度≤2R OutLine3 圆外直线3 与大圆非包含长度≤3R 填充属性 HatchNum 填充数量 填充块的数量 文字属性 WordType 文字类型 图例文字分类 表 4 聚类算法数据结果
TP FP FN FMI DBSCAN 1539 120 225 0.899634 OPTICS 1666 186 32 0.9394759 CLIQUE 1728 92 64 0.9568393 RV-DBSCAN 1832 34 18 0.9860155 表 5 分类算法结果
测试样本总数 信号固定设备 信号机 站场固定设备 459 92 107 260 组合
决策树模型正确分类数 439 86 105 248 一级正判率 99.35% 97.83% 100.00% 99.62% 二级正判率 96.08% 93.48% 100.00% 95.38% 三级正判率 95.64% 93.48% 97.22% 95.38% 单决策树模型 正确分类数 423 82 98 243 正判率 92.16% 89.13% 90.74% 93.46% KNN
模型正确分类数 385 78 75 232 正判率 83.88% 84.78% 69.44% 89.23% SVM
模型正确分类数 398 74 86 238 正判率 86.71% 80.43% 79.63% 91.54% 表 6 生成联锁表所需数据格式
信号设备 属性 信号机 类型(列车、调车);种类(进站、出站、单置、并置、差置);坐标;高矮柱;朝向 道岔 类型(单动、双动、渡线);岔尖坐标;岔心坐标;定位坐标、反位坐标 区段 类型(无岔、有岔、股道);左侧坐标;右侧坐标 其他 类型(侵限绝缘、机械绝缘);坐标 -
[1] 罗宏伟. 铁路站场设计系统研究与开发 [J]. 铁道标准设计,2018,62(5):37-39,44. DOI: 10.13238/j.issn.1004-2954.201708050002 [2] 李茂蛟. BIM技术在铁路信号工程设计中的应用研究 [J]. 铁道勘察,2020,46(1):144-149. DOI: 10.19630/j.cnki.tdkc.201909060014 [3] 陈 刚. 基于三维空间模型的铁路站场平纵横一体化设计软件研究 [J]. 铁路计算机应用,2017,26(10):28-31,48. DOI: 10.3969/j.issn.1005-8451.2017.10.009 [4] 安春兰. 铁路车站信号平面布置图的计算机辅助设计[D]. 成都: 西南交通大学, 2011. [5] 程耀东,潘永健,朱奕蓓,等. 高速铁路综合图自动生成关键技术研究 [J]. 铁道标准设计.,2015,59(10):42-45,53. [6] 付 强,袁 磊. 基于聚类分析及SVM的DMI机车信号自动识别 [J]. 铁路计算机应用,2015,24(8):46-49. DOI: 10.3969/j.issn.1005-8451.2015.08.013 [7] 黄孝章,刘双双. 铁路站场平面图CAD系统中图形信息的自动识别和提取方法 [J]. 交通与计算机,1998,16(2):53-57. [8] 张天祖,吕兴寿. 铁路站场平面图中主要元素的自动识别算法 [J]. 兰州交通大学学报,2013,32(3):124-127,163. DOI: 10.3969/j.issn.1001-4373.2013.04.027 [9] 王 飞. 基于图像处理和神经网络的站场状态信息识别方法 [J]. 铁道通信信号,2021,57(3):60-63. DOI: 10.13879/j.issn.1000-7458.2021-03.20513 [10] Lu Q C, Chen L, Li S, et al. Semi-automatic geometric digital twinning for existing buildings based on images and CAD drawings [J]. Automation in Construction, 2020(115): 103183. DOI: 10.1016/j.autcon.2020.103183
[11] Scheibel B, Mangler J, Rinderle-Ma S. Extraction of dimension requirements from engineering drawings for supporting quality control in production processes [J]. Computers in Industry, 2021, 129: 103442. DOI: 10.1016/j.compind.2021.103442
[12] Wen R, Tang W Q, Su Z Y. Topology based 2D engineering drawing and 3D model matching for process plant [J]. Graphical Models, 2017(92): 1-15. DOI: 10.1016/j.gmod.2017.06.001
[13] 李 锐. DXF建筑工程图的读取、识别与三维重建[D]. 天津: 天津大学, 2017. [14] 国家铁路局. 铁路工程制图图形符号标准: TB/T 10059-2015[S]. 北京: 中国铁道出版社, 2015. [15] Angelini P, Frati F, Kaufmann K. Straight-line rectangular drawings of clustered graphs [J]. Discrete & Computational Geometry, 2011, 45(1): 88-140.
[16] 朱文博,王小敏. 基于组合决策树的无绝缘轨道电路故障诊断方法研究 [J]. 铁道学报,2018,40(7):74-79. DOI: 10.3969/j.issn.1001-8360.2018.07.011 -
期刊类型引用(4)
1. 王娜娜,张建国. 铁路货运营销大数据系统的设计与实现. 铁路计算机应用. 2024(05): 36-39 . 本站查看
2. 贾倩新,李建国,文慈,向万里. 基于RFM模型的铁路保价运输客户细分. 青海交通科技. 2023(03): 23-31+60 . 百度学术
3. 张涛. 基于铁路通勤用户需求的铁路新票制产品设计. 铁路计算机应用. 2022(01): 9-14 . 本站查看
4. 聂欣,田佳禾,胡培博,万爱霞. 基于AHP的客户价值综合评价体系研究. 中外企业文化. 2022(05): 76-78 . 百度学术
其他类型引用(3)