• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

基于数据挖掘的铁路车站信号平面布置图信息提取

龙芳, 杨扬

龙芳, 杨扬. 基于数据挖掘的铁路车站信号平面布置图信息提取[J]. 铁路计算机应用, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
引用本文: 龙芳, 杨扬. 基于数据挖掘的铁路车站信号平面布置图信息提取[J]. 铁路计算机应用, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
LONG Fang, YANG Yang. Information extraction of railway station signal layout plan based on data mining[J]. Railway Computer Application, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01
Citation: LONG Fang, YANG Yang. Information extraction of railway station signal layout plan based on data mining[J]. Railway Computer Application, 2022, 31(12): 1-7. DOI: 10.3969/j.issn.1005-8451.2022.12.01

基于数据挖掘的铁路车站信号平面布置图信息提取

基金项目: 中国铁路总公司科技研究开发计划课题(2017X011-A)
详细信息
    作者简介:

    龙 芳,在读硕士研究生

    杨 扬,副教授

  • 中图分类号: U284.3 : TP39

Information extraction of railway station signal layout plan based on data mining

  • 摘要: 针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RV-DBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法FMI评分0.9860,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。
    Abstract: AAiming at the problem that the data of railway station signal layout plan cannot be reused due to different data formats, this paper presented a data mining based method for extracting information from railway station signal layout plan. The paper constructs the model and code of railway signal engineering legend, and clusters the graphic data into graphic groups based on RV-DBSCAN algorithm, constructed a model through C4.5 decision tree to identify railway signal legend. The test results shows that the FMI score of the clustering method is 0.9860, and the accuracy rate of the classification algorithm is 95.64%. It can accurately identify the legend symbol data in the layout plan, and provides a general data interface for the secondary use of the layout plan information.
  • 建筑信息模型(BIM,Building Information Modeling)技术为建设项目全生命周期信息化管理提供了先进的数字化工具和信息共享平台[1]。在国家《“十四五”铁路发展规划》中,明确提出深化基于BIM技术的铁路建设运维研究。BIM技术以其承载的高精度三维可视化模型和海量信息属性,为铁路项目全生命周期管理打下了坚实的数字化基础[2]。然而,大体量BIM交互操作需要依赖专业的应用软件及高配置计算机硬件资源,导致BIM应用技术的普及存在较高门槛。

    近年来,随着WebGL技术的迭代发展,基于B/S架构的BIM交互应用方案为BIM应用提供解决思路。文献[36]均提出了基于B/S架构的BIM+地理信息系统(GIS,Geographic Information System)融合方案,实现对铁路、轨道交通等项目中大范围、大场景BIM的可视化操作。其基本原理是通过对BIM成果文件进行轻量化及切片处理,将BIM设计成果文件转换成支持WebGL渲染的瓦片数据集;随后利用前端Cesium、Three.js等渲染引擎,实现在浏览器端加载渲染BIM,并进行交互应用[7-8]。但这些应用方案仍存在以下不足之处:

    (1)BIM切片处理技术难度较高,目前国内大部分研究方案[9-10]是通过SuperMap商业软件进行处理;

    (2)BIM在客户端的呈现原理是根据用户可视范围需求,实时从服务端获取相应切片数据集渲染,对网络带宽及稳定性要求较高,而部分工程现场远离城市,较难满足要求。因此,在某些仅在部分专业、场段而未全线开展BIM建模的情况下,BIM+GIS融合方案部署技术难度较大、成本较高,其超大场景渲染优势也无法体现。

    鉴于此,本文研发并设计了基于.NET6的铁路BIM可视化综合应用系统,着重实现对铁路单工点、单场段范围内BIM成果的可视化应用。并实现了模型动态场景演示、物资管理系统数据融合等功能,进一步丰富BIM数据交互应用场景。

    基于.NET6的铁路BIM可视化综合应用系统主要使用对象是铁路工程设计、建设、运营等过程中的各类专业人员。为满足用户便捷应用需求,系统采用B/S架构,用户可通过电脑、手机等设备浏览器实现BIM交互应用。为方便非专业开发人员快捷部署及发布BIM,系统待用户上传模型数据后,服务器端可自动完成模型转换、数模拆分发布等工作,同时发布标准数据接口以便与其他系统进行数据融合应用。铁路BIM可视化综合应用系统主要分为输入层、数据处理层和应用层,总体架构如图1所示。

    图  1  BIM可视化综合应用系统总体架构

    利用各BIM设计平台软件生产BIM成果,并统一生成工业基础类(IFC,Industry Foundation Class)文件,上传到数据处理层的服务器中。

    通过对IFC文件进行解析,对其进行数模分离。其中,几何模型文件转换为支持WebGL渲染的格式;非几何数据进行数据清洗后得到有效数据,并通过数据库进行存储。同步建立各类数据分发接口,供应用层通过应用程序接口(API,Application Program Interface)访问各类应用数据。

    用户通过电脑、手机等设备浏览器与数据处理层数据库进行数据交互,实现BIM在浏览器端的各类基本操作、属性数据查询等功能,同时支持与物资管理系统等外部系统进行数据关联操作,实现BIM与实体设备的状态查询与异常告警。

    现阶段铁路项目BIM设计成果主要以IFC格式输出交付。由于IFC文件包含许多语义属性,在交付后的实际应用过程中,未简化的模型会导致每次调用必须加载大量信息,渲染大规模的模型,使得加载时间延长甚至加载崩溃。而WebGL技术将JavaScript和OpenGL ES 2.0结合在一起,实现在HTML5 Canvas DOM中绘制三维图。但是在基于WebGL技术的B/S架构应用方案中,IFC格式本身无法支持WebGL技术的读取和加载,因此需要对IFC文件进行解析转换。

    为了实现IFC文件的灵活解析,本文利用xBIM Essentials和xBIM Geometry 开源组件,在服务端部署文件自动转换服务,对用户上传的IFC文件进行解析,通过遮挡剔除、相似合并、参数化转片面和三角面等几何数据处理过程后, 创建支持WebGL渲染的WexBIM文件[11-12];在前端通过部署Layui框架[13]及xBIM WebUI框架,实现网页端对模型的加载渲染呈现,并提供基础缩放、旋转、漫游、隐藏、剖切等交互功能。

    IFC文件可附加属性信息,若每次交互访问直接读取IFC文件获取属性数据,需要较长的解析时间,影响用户体验。本文通过将IFC文件里的属性数据与几何模型数据进行拆分,将拆分后的数据直接存入数据库中,后续利用数据库高I/O性能直接访问模型附加属性数据,显著提高访问速度。IFC文件数模拆分原理如图2所示。

    图  2  IFC文件数模拆分原理

    用户上传IFC文件后,由系统服务端对其进行数模拆分转换,将几何数据与非几何数据进行分离。其中,几何数据作为文件直接存储,文件格式支持Web端直接渲染展示;非几何数据中的模型附件属性数据通过筛选得到有效设计数据后,转换为JSON数据格式进行存储,一个模型构件对应一条JSON属性数据,有效减少数据存储量,同步支持扩展施工数据、厂家数据及运营数据。

    为了在数模拆分过程中保持数据与模型构件的关联,可以利用每一个IFC构件的全球唯一标识(GUID,Global Unique Identifier)特性,将几何构件ID与JSON属性数据通过GUID绑定,实现数模分离后模型与附加属性的关联。用户在浏览器端进行操作时,可通过几何数据文件直接在网页端渲染加载模型,并在点击具体构件模型时,根据获取的GUID在数据库查询模型对应的各类属性信息。

    将IFC文件转换为支持WebGL渲染的WebBIM格式文件过程中,虽然通过模型轻量化处理后,文件体量得到显著缩减,但是如果每次浏览器加载显示都需要从服务器端访问获取WebBIM文件,文件在网络传输过程中仍会延迟,在施工现场等网络环境恶劣的条件下可能导致无法访问使用。为了解决该问题,本文研究利用浏览器缓存技术,BIM文件首次下载渲染后,同步将模型缓存在用户浏览器内,后续访问相同BIM,则直接从本地浏览器端加载缓存数据,提高访问速度。

    由于浏览器缓存常用的cookie、localStorage 2种方法存储空间有限,均不符合本次研究缓存要求。本文通过研究IndexedDB浏览器数据库存储技术,实现大容量缓存[14]。利用IndexedDB建立缓存模型数据表,每个BIM作为一条缓存数据,其中的Key和服务器端IFC文件的GUID编号保持一致,value设为三维模型文件的二进制Blob数据。此外,还需要对xBIM WebUI前端组件进行二次开发,修改其模型加载技术方案。

    模型文件通过“项目–工点–模型文件”的3层级模式管理,使得一个项目可以承载多个工点,一个工点也可以承载多个模型文件。用户在查看某一工点模型时,可先预览该工点主模型,再在模型浏览界面对多个模型进行任意叠加、卸载。

    客户端通过浏览器加载模型后,用户可在三维模型呈现页面实现模型交互操作,包括模型缩放、旋转、透视、剖切、漫游、标签、测量等功能。通过对剖切数据进行云端存储,可实现针对单体建筑的楼层剖切预设,用户在后续使用过程中可通过剖切预设快速切换楼层视角。

    服务器端对IFC文件进行数模分离后,IFC文件附加属性数据以JSON格式存储至服务器数据库。在模型交互过程中,双击模型构件,系统可根据模型ID在服务器端快速获取JSON格式属性数据并在前端呈现。实现BIM在WebGL渲染交互模式下属性数据的实时查询。

    在BIM交互应用过程中,尤其是利用BIM进行设计交底、运行维护培训时,需要通过剖切、颜色调整、部分类型设备设施隐藏等方式,切换符合成需求的某个模型视角场景,并对这一场景预设保存。系统的动态场景演示功能模块可供用户提前创建BIM不同视角的快照记录,并附以文字图片说明进行预设保存,演示效果如图3所示。

    图  3  动态场景演示效果

    通过动态场景演示功能,用户点击不同场景记录缩略图时,随即自动渲染至创建该场景时的视角状态,并自动打开备注说明页面。该功能充分利用了BIM可视化、精细化的特点,提升了用户体验感。

    结合主要设备BIM清单功能,通过公开的API接口规范,可将BIM可视化综合应用系统与四电物资管理系统进行数据融合交互。由BIM可视化综合应用系统将BIM设备清单直接推送至物资管理系统。物资管理系统根据主要设备清单进入采购流程,利用射频识别(RFID,Radio Frequency Identification)、二维码等方式绑定实际设备,并用现场手持终端在采购、出入库、安装等各个环节录入物资状态。BIM可视化综合应用系统根据模型ID获取实际设备物资状态信息,同时,根据不同状态对设备标记不同颜色,直观展示整体工程进度,如图4所示。

    图  4  物资管理与BIM可视化综合应用系统数据融合交互

    通过对IFC文件解析转换、数模分离发布、三维模型离线缓存等关键技术的研究,本文设计了一套基于.NET6的铁路BIM可视化综合应用系统。系统集模型解析、部署、应用于一体,针对铁路单工点或单场段BIM进行部署应用时,有明显的优势,是对现有BIM+GIS大体量模型部署方案的有效补充。其动态场景演示功能,在设计施工交底、教学培训中可任意切换预设场景展示,充分发挥BIM三维模型高精度可视化的优势。此外,系统的数据融合功能可为BIM+RFID全生命周期铁路物资管控提供更大的发展空间。

  • 图  1   车站信号平面布置示意

    图  2   信号图例同构混乱与格式混乱示例

    图  3   车站信号平面布置图数据信息提取流程

    图  4   图例分类组合决策树

    图  5   树节点2-4分类决策树

    图  6   聚类算法图形结果示例

    表  1   信号图例分类与编码

    一级分类二级分类三级分类与编号
    信号机一灯位复示-L:1_1_1复示-B:1_1_2超限绝缘:1_1_3
    二灯位出站-LH:1_2_1预告-LU:1_2_2调车-EB:1_2_3
    表示器-2:1_2_4调车-HB:1_2_5 
    三灯位出站-HLB:1_3_1出站-LHL:1_3_2通过-HLU:1_3_3
    四灯位出站-LHLB:1_4_1出站-LHUB:1_4_2出站-LHUL:1_4_3
    出站-LUHB2调车-EBEB2:1_4_5驼峰-LHUB:1_4_6
    五灯位进站-ULHUB:1_5_1进站-ULHUB:1_5_2出站-LXLHB:1_5_3
    出站-LXLUB:1_5_4出站-LHULB:1_5_5 
    六灯位及以上进站-LUXUHBX2:1_6_1接车进路-XBBUHLU:1_6_2接车进路-XBBLUHLU:1_6_3
    轨道电路及信号固定设备轨道电路设备钢轨绝缘:2_1_1尽头绝缘:2_1_2电气绝缘:2_1_3
    信号固定设备应答器:2_2_1区间信号
    标志牌:2_2_2
     
    站场固定设备道岔及其转换设备尽头线:3_1_1道岔:3_1_2 
    站场固定设施信号楼:3_2_1调车楼:3_2_2警冲标:3_2_3
    下载: 导出CSV

    表  2   图形图元矩形σ邻域

    图元类型矩形σ邻域
    Circle(cx,cy,cr)xmax=cx+cr, xmin=cx-cr,
    ymax=cy+cr, ymin=cy-cr
    Line(x1,y1,x2,y2)xmax=max(x1,x2), xmin=min(x1,x2)
    ymax=max(y1,y2), ymin=min(y1,y2)
    Hatch(edge1,
    edge2,···,htype
    xmax=max(x1,···,xn), xmin=min(x1,···,xn)
    ymax= max(y1,···,yn), xmin=min(y1,···,yn)
    Text(x1,y1,content, fontsize)ymax=x1+len(content)· fontsize,xmin=x1
    ymax=y1+fontsize,ymin=y1
    下载: 导出CSV

    表  3   图形拓扑特征属性

    属性类别属性名称属性备注属性解释
    圆属性BigNum大圆个数图形组中大圆的个数
    HorGap大圆横坐标差比值大圆最远横坐标差值与半径的比值
    VerGap大圆纵坐标差比值大圆最远纵坐标差值与半径的比值
    InSamll大圆内小圆大圆内含的小圆
    OutSmall大圆外小圆大圆外离的小圆
    直线属性InLine1圆内直线1与大圆包含长度≤R
    InLine2圆内直线2与大圆包含长度≤2R
    OutLine1圆外直线1与大圆非包含长度≤R
    OutLine2圆外直线2与大圆非包含长度≤2R
    OutLine3圆外直线3与大圆非包含长度≤3R
    填充属性HatchNum填充数量填充块的数量
    文字属性WordType文字类型图例文字分类
    下载: 导出CSV

    表  4   聚类算法数据结果

     TPFPFNFMI
    DBSCAN15391202250.899634
    OPTICS1666186320.9394759
    CLIQUE172892640.9568393
    RV-DBSCAN183234180.9860155
    下载: 导出CSV

    表  5   分类算法结果

    测试样本总数信号固定设备信号机站场固定设备
    45992107260
    组合
    决策树模型
    正确分类数43986105248
    一级正判率99.35%97.83%100.00%99.62%
    二级正判率96.08%93.48%100.00%95.38%
    三级正判率95.64%93.48%97.22%95.38%
    单决策树模型正确分类数4238298243
    正判率92.16%89.13%90.74%93.46%
    KNN
    模型
    正确分类数3857875232
    正判率83.88%84.78%69.44%89.23%
    SVM
    模型
    正确分类数3987486238
    正判率86.71%80.43%79.63%91.54%
    下载: 导出CSV

    表  6   生成联锁表所需数据格式

    信号设备属性
    信号机类型(列车、调车);种类(进站、出站、单置、并置、差置);坐标;高矮柱;朝向
    道岔类型(单动、双动、渡线);岔尖坐标;岔心坐标;定位坐标、反位坐标
    区段类型(无岔、有岔、股道);左侧坐标;右侧坐标
    其他类型(侵限绝缘、机械绝缘);坐标
    下载: 导出CSV
  • [1] 罗宏伟. 铁路站场设计系统研究与开发 [J]. 铁道标准设计,2018,62(5):37-39,44. DOI: 10.13238/j.issn.1004-2954.201708050002
    [2] 李茂蛟. BIM技术在铁路信号工程设计中的应用研究 [J]. 铁道勘察,2020,46(1):144-149. DOI: 10.19630/j.cnki.tdkc.201909060014
    [3] 陈 刚. 基于三维空间模型的铁路站场平纵横一体化设计软件研究 [J]. 铁路计算机应用,2017,26(10):28-31,48. DOI: 10.3969/j.issn.1005-8451.2017.10.009
    [4] 安春兰. 铁路车站信号平面布置图的计算机辅助设计[D]. 成都: 西南交通大学, 2011.
    [5] 程耀东,潘永健,朱奕蓓,等. 高速铁路综合图自动生成关键技术研究 [J]. 铁道标准设计.,2015,59(10):42-45,53.
    [6] 付 强,袁 磊. 基于聚类分析及SVM的DMI机车信号自动识别 [J]. 铁路计算机应用,2015,24(8):46-49. DOI: 10.3969/j.issn.1005-8451.2015.08.013
    [7] 黄孝章,刘双双. 铁路站场平面图CAD系统中图形信息的自动识别和提取方法 [J]. 交通与计算机,1998,16(2):53-57.
    [8] 张天祖,吕兴寿. 铁路站场平面图中主要元素的自动识别算法 [J]. 兰州交通大学学报,2013,32(3):124-127,163. DOI: 10.3969/j.issn.1001-4373.2013.04.027
    [9] 王 飞. 基于图像处理和神经网络的站场状态信息识别方法 [J]. 铁道通信信号,2021,57(3):60-63. DOI: 10.13879/j.issn.1000-7458.2021-03.20513
    [10]

    Lu Q C, Chen L, Li S, et al. Semi-automatic geometric digital twinning for existing buildings based on images and CAD drawings [J]. Automation in Construction, 2020(115): 103183. DOI: 10.1016/j.autcon.2020.103183

    [11]

    Scheibel B, Mangler J, Rinderle-Ma S. Extraction of dimension requirements from engineering drawings for supporting quality control in production processes [J]. Computers in Industry, 2021, 129: 103442. DOI: 10.1016/j.compind.2021.103442

    [12]

    Wen R, Tang W Q, Su Z Y. Topology based 2D engineering drawing and 3D model matching for process plant [J]. Graphical Models, 2017(92): 1-15. DOI: 10.1016/j.gmod.2017.06.001

    [13] 李 锐. DXF建筑工程图的读取、识别与三维重建[D]. 天津: 天津大学, 2017.
    [14] 国家铁路局. 铁路工程制图图形符号标准: TB/T 10059-2015[S]. 北京: 中国铁道出版社, 2015.
    [15]

    Angelini P, Frati F, Kaufmann K. Straight-line rectangular drawings of clustered graphs [J]. Discrete & Computational Geometry, 2011, 45(1): 88-140.

    [16] 朱文博,王小敏. 基于组合决策树的无绝缘轨道电路故障诊断方法研究 [J]. 铁道学报,2018,40(7):74-79. DOI: 10.3969/j.issn.1001-8360.2018.07.011
  • 期刊类型引用(2)

    1. 吕东,王婧,杨璟林,周清华,黄新文,赵博洋,薛宇腾. 基于WebGL引擎的铁路工程BIM+GIS平台研发及(设计阶段)应用. 铁道标准设计. 2023(10): 62-69 . 百度学术
    2. 朱一. 基于BIM的铁路工程单元虚拟建造关键技术研究. 铁路计算机应用. 2023(10): 32-35 . 本站查看

    其他类型引用(1)

图(6)  /  表(6)
计量
  • 文章访问数:  166
  • HTML全文浏览量:  114
  • PDF下载量:  60
  • 被引次数: 3
出版历程
  • 收稿日期:  2022-05-29
  • 刊出日期:  2022-12-29

目录

/

返回文章
返回