Information extraction of railway station signal layout plan based on data mining
-
摘要: 针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RV-DBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法FMI评分0.9860,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。Abstract: AAiming at the problem that the data of railway station signal layout plan cannot be reused due to different data formats, this paper presented a data mining based method for extracting information from railway station signal layout plan. The paper constructs the model and code of railway signal engineering legend, and clusters the graphic data into graphic groups based on RV-DBSCAN algorithm, constructed a model through C4.5 decision tree to identify railway signal legend. The test results shows that the FMI score of the clustering method is 0.9860, and the accuracy rate of the classification algorithm is 95.64%. It can accurately identify the legend symbol data in the layout plan, and provides a general data interface for the secondary use of the layout plan information.
-
建筑信息模型(BIM,Building Information Modeling)技术为建设项目全生命周期信息化管理提供了先进的数字化工具和信息共享平台[1]。在国家《“十四五”铁路发展规划》中,明确提出深化基于BIM技术的铁路建设运维研究。BIM技术以其承载的高精度三维可视化模型和海量信息属性,为铁路项目全生命周期管理打下了坚实的数字化基础[2]。然而,大体量BIM交互操作需要依赖专业的应用软件及高配置计算机硬件资源,导致BIM应用技术的普及存在较高门槛。
近年来,随着WebGL技术的迭代发展,基于B/S架构的BIM交互应用方案为BIM应用提供解决思路。文献[3—6]均提出了基于B/S架构的BIM+地理信息系统(GIS,Geographic Information System)融合方案,实现对铁路、轨道交通等项目中大范围、大场景BIM的可视化操作。其基本原理是通过对BIM成果文件进行轻量化及切片处理,将BIM设计成果文件转换成支持WebGL渲染的瓦片数据集;随后利用前端Cesium、Three.js等渲染引擎,实现在浏览器端加载渲染BIM,并进行交互应用[7-8]。但这些应用方案仍存在以下不足之处:
(1)BIM切片处理技术难度较高,目前国内大部分研究方案[9-10]是通过SuperMap商业软件进行处理;
(2)BIM在客户端的呈现原理是根据用户可视范围需求,实时从服务端获取相应切片数据集渲染,对网络带宽及稳定性要求较高,而部分工程现场远离城市,较难满足要求。因此,在某些仅在部分专业、场段而未全线开展BIM建模的情况下,BIM+GIS融合方案部署技术难度较大、成本较高,其超大场景渲染优势也无法体现。
鉴于此,本文研发并设计了基于.NET6的铁路BIM可视化综合应用系统,着重实现对铁路单工点、单场段范围内BIM成果的可视化应用。并实现了模型动态场景演示、物资管理系统数据融合等功能,进一步丰富BIM数据交互应用场景。
1 系统整体设计
基于.NET6的铁路BIM可视化综合应用系统主要使用对象是铁路工程设计、建设、运营等过程中的各类专业人员。为满足用户便捷应用需求,系统采用B/S架构,用户可通过电脑、手机等设备浏览器实现BIM交互应用。为方便非专业开发人员快捷部署及发布BIM,系统待用户上传模型数据后,服务器端可自动完成模型转换、数模拆分发布等工作,同时发布标准数据接口以便与其他系统进行数据融合应用。铁路BIM可视化综合应用系统主要分为输入层、数据处理层和应用层,总体架构如图1所示。
1.1 输入层
利用各BIM设计平台软件生产BIM成果,并统一生成工业基础类(IFC,Industry Foundation Class)文件,上传到数据处理层的服务器中。
1.2 数据处理层
通过对IFC文件进行解析,对其进行数模分离。其中,几何模型文件转换为支持WebGL渲染的格式;非几何数据进行数据清洗后得到有效数据,并通过数据库进行存储。同步建立各类数据分发接口,供应用层通过应用程序接口(API,Application Program Interface)访问各类应用数据。
1.3 应用层
用户通过电脑、手机等设备浏览器与数据处理层数据库进行数据交互,实现BIM在浏览器端的各类基本操作、属性数据查询等功能,同时支持与物资管理系统等外部系统进行数据关联操作,实现BIM与实体设备的状态查询与异常告警。
2 关键技术
2.1 IFC文件解析转换
现阶段铁路项目BIM设计成果主要以IFC格式输出交付。由于IFC文件包含许多语义属性,在交付后的实际应用过程中,未简化的模型会导致每次调用必须加载大量信息,渲染大规模的模型,使得加载时间延长甚至加载崩溃。而WebGL技术将JavaScript和OpenGL ES 2.0结合在一起,实现在HTML5 Canvas DOM中绘制三维图。但是在基于WebGL技术的B/S架构应用方案中,IFC格式本身无法支持WebGL技术的读取和加载,因此需要对IFC文件进行解析转换。
为了实现IFC文件的灵活解析,本文利用xBIM Essentials和xBIM Geometry 开源组件,在服务端部署文件自动转换服务,对用户上传的IFC文件进行解析,通过遮挡剔除、相似合并、参数化转片面和三角面等几何数据处理过程后, 创建支持WebGL渲染的WexBIM文件[11-12];在前端通过部署Layui框架[13]及xBIM WebUI框架,实现网页端对模型的加载渲染呈现,并提供基础缩放、旋转、漫游、隐藏、剖切等交互功能。
2.2 IFC文件数模分离及属性数据存储
IFC文件可附加属性信息,若每次交互访问直接读取IFC文件获取属性数据,需要较长的解析时间,影响用户体验。本文通过将IFC文件里的属性数据与几何模型数据进行拆分,将拆分后的数据直接存入数据库中,后续利用数据库高I/O性能直接访问模型附加属性数据,显著提高访问速度。IFC文件数模拆分原理如图2所示。
用户上传IFC文件后,由系统服务端对其进行数模拆分转换,将几何数据与非几何数据进行分离。其中,几何数据作为文件直接存储,文件格式支持Web端直接渲染展示;非几何数据中的模型附件属性数据通过筛选得到有效设计数据后,转换为JSON数据格式进行存储,一个模型构件对应一条JSON属性数据,有效减少数据存储量,同步支持扩展施工数据、厂家数据及运营数据。
为了在数模拆分过程中保持数据与模型构件的关联,可以利用每一个IFC构件的全球唯一标识(GUID,Global Unique Identifier)特性,将几何构件ID与JSON属性数据通过GUID绑定,实现数模分离后模型与附加属性的关联。用户在浏览器端进行操作时,可通过几何数据文件直接在网页端渲染加载模型,并在点击具体构件模型时,根据获取的GUID在数据库查询模型对应的各类属性信息。
2.3 三维模型浏览器端缓存技术
将IFC文件转换为支持WebGL渲染的WebBIM格式文件过程中,虽然通过模型轻量化处理后,文件体量得到显著缩减,但是如果每次浏览器加载显示都需要从服务器端访问获取WebBIM文件,文件在网络传输过程中仍会延迟,在施工现场等网络环境恶劣的条件下可能导致无法访问使用。为了解决该问题,本文研究利用浏览器缓存技术,BIM文件首次下载渲染后,同步将模型缓存在用户浏览器内,后续访问相同BIM,则直接从本地浏览器端加载缓存数据,提高访问速度。
由于浏览器缓存常用的cookie、localStorage 2种方法存储空间有限,均不符合本次研究缓存要求。本文通过研究IndexedDB浏览器数据库存储技术,实现大容量缓存[14]。利用IndexedDB建立缓存模型数据表,每个BIM作为一条缓存数据,其中的Key和服务器端IFC文件的GUID编号保持一致,value设为三维模型文件的二进制Blob数据。此外,还需要对xBIM WebUI前端组件进行二次开发,修改其模型加载技术方案。
3 系统功能
3.1 多模型叠加及卸载
模型文件通过“项目–工点–模型文件”的3层级模式管理,使得一个项目可以承载多个工点,一个工点也可以承载多个模型文件。用户在查看某一工点模型时,可先预览该工点主模型,再在模型浏览界面对多个模型进行任意叠加、卸载。
3.2 客户端交互操作
客户端通过浏览器加载模型后,用户可在三维模型呈现页面实现模型交互操作,包括模型缩放、旋转、透视、剖切、漫游、标签、测量等功能。通过对剖切数据进行云端存储,可实现针对单体建筑的楼层剖切预设,用户在后续使用过程中可通过剖切预设快速切换楼层视角。
3.3 属性查询
服务器端对IFC文件进行数模分离后,IFC文件附加属性数据以JSON格式存储至服务器数据库。在模型交互过程中,双击模型构件,系统可根据模型ID在服务器端快速获取JSON格式属性数据并在前端呈现。实现BIM在WebGL渲染交互模式下属性数据的实时查询。
3.4 动态场景演示
在BIM交互应用过程中,尤其是利用BIM进行设计交底、运行维护培训时,需要通过剖切、颜色调整、部分类型设备设施隐藏等方式,切换符合成需求的某个模型视角场景,并对这一场景预设保存。系统的动态场景演示功能模块可供用户提前创建BIM不同视角的快照记录,并附以文字图片说明进行预设保存,演示效果如图3所示。
通过动态场景演示功能,用户点击不同场景记录缩略图时,随即自动渲染至创建该场景时的视角状态,并自动打开备注说明页面。该功能充分利用了BIM可视化、精细化的特点,提升了用户体验感。
3.5 物资管理系统数据融合
结合主要设备BIM清单功能,通过公开的API接口规范,可将BIM可视化综合应用系统与四电物资管理系统进行数据融合交互。由BIM可视化综合应用系统将BIM设备清单直接推送至物资管理系统。物资管理系统根据主要设备清单进入采购流程,利用射频识别(RFID,Radio Frequency Identification)、二维码等方式绑定实际设备,并用现场手持终端在采购、出入库、安装等各个环节录入物资状态。BIM可视化综合应用系统根据模型ID获取实际设备物资状态信息,同时,根据不同状态对设备标记不同颜色,直观展示整体工程进度,如图4所示。
4 结束语
通过对IFC文件解析转换、数模分离发布、三维模型离线缓存等关键技术的研究,本文设计了一套基于.NET6的铁路BIM可视化综合应用系统。系统集模型解析、部署、应用于一体,针对铁路单工点或单场段BIM进行部署应用时,有明显的优势,是对现有BIM+GIS大体量模型部署方案的有效补充。其动态场景演示功能,在设计施工交底、教学培训中可任意切换预设场景展示,充分发挥BIM三维模型高精度可视化的优势。此外,系统的数据融合功能可为BIM+RFID全生命周期铁路物资管控提供更大的发展空间。
-
表 1 信号图例分类与编码
一级分类 二级分类 三级分类与编号 信号机 一灯位 复示-L:1_1_1 复示-B:1_1_2 超限绝缘:1_1_3 二灯位 出站-LH:1_2_1 预告-LU:1_2_2 调车-EB:1_2_3 表示器-2:1_2_4 调车-HB:1_2_5 三灯位 出站-HLB:1_3_1 出站-LHL:1_3_2 通过-HLU:1_3_3 四灯位 出站-LHLB:1_4_1 出站-LHUB:1_4_2 出站-LHUL:1_4_3 出站-LUHB2 调车-EBEB2:1_4_5 驼峰-LHUB:1_4_6 五灯位 进站-ULHUB:1_5_1 进站-ULHUB:1_5_2 出站-LXLHB:1_5_3 出站-LXLUB:1_5_4 出站-LHULB:1_5_5 六灯位及以上 进站-LUXUHBX2:1_6_1 接车进路-XBBUHLU:1_6_2 接车进路-XBBLUHLU:1_6_3 轨道电路及信号固定设备 轨道电路设备 钢轨绝缘:2_1_1 尽头绝缘:2_1_2 电气绝缘:2_1_3 信号固定设备 应答器:2_2_1 区间信号
标志牌:2_2_2站场固定设备 道岔及其转换设备 尽头线:3_1_1 道岔:3_1_2 站场固定设施 信号楼:3_2_1 调车楼:3_2_2 警冲标:3_2_3 表 2 图形图元矩形σ邻域
图元类型 矩形σ邻域 Circle(cx,cy,cr) xmax=cx+cr, xmin=cx-cr,
ymax=cy+cr, ymin=cy-crLine(x1,y1,x2,y2) x max=max(x1,x2), xmin=min(x1,x2)
ymax=max(y1,y2) , ymin=min(y1,y2) Hatch(edge1,
edge2,···,htype)xmax=max(x1,···,xn), xmin=min(x1,···,xn)
ymax= max(y1,···,yn), xmin=min(y1,···,yn)Text(x1,y1,content, fontsize) ymax=x1+len(content)· fontsize,xmin=x1
ymax=y1+fontsize,ymin=y1表 3 图形拓扑特征属性
属性类别 属性名称 属性备注 属性解释 圆属性 BigNum 大圆个数 图形组中大圆的个数 HorGap 大圆横坐标差比值 大圆最远横坐标差值与半径的比值 VerGap 大圆纵坐标差比值 大圆最远纵坐标差值与半径的比值 InSamll 大圆内小圆 大圆内含的小圆 OutSmall 大圆外小圆 大圆外离的小圆 直线属性 InLine1 圆内直线1 与大圆包含长度≤R InLine2 圆内直线2 与大圆包含长度≤2R OutLine1 圆外直线1 与大圆非包含长度≤R OutLine2 圆外直线2 与大圆非包含长度≤2R OutLine3 圆外直线3 与大圆非包含长度≤3R 填充属性 HatchNum 填充数量 填充块的数量 文字属性 WordType 文字类型 图例文字分类 表 4 聚类算法数据结果
TP FP FN FMI DBSCAN 1539 120 225 0.899634 OPTICS 1666 186 32 0.9394759 CLIQUE 1728 92 64 0.9568393 RV-DBSCAN 1832 34 18 0.9860155 表 5 分类算法结果
测试样本总数 信号固定设备 信号机 站场固定设备 459 92 107 260 组合
决策树模型正确分类数 439 86 105 248 一级正判率 99.35% 97.83% 100.00% 99.62% 二级正判率 96.08% 93.48% 100.00% 95.38% 三级正判率 95.64% 93.48% 97.22% 95.38% 单决策树模型 正确分类数 423 82 98 243 正判率 92.16% 89.13% 90.74% 93.46% KNN
模型正确分类数 385 78 75 232 正判率 83.88% 84.78% 69.44% 89.23% SVM
模型正确分类数 398 74 86 238 正判率 86.71% 80.43% 79.63% 91.54% 表 6 生成联锁表所需数据格式
信号设备 属性 信号机 类型(列车、调车);种类(进站、出站、单置、并置、差置);坐标;高矮柱;朝向 道岔 类型(单动、双动、渡线);岔尖坐标;岔心坐标;定位坐标、反位坐标 区段 类型(无岔、有岔、股道);左侧坐标;右侧坐标 其他 类型(侵限绝缘、机械绝缘);坐标 -
[1] 罗宏伟. 铁路站场设计系统研究与开发 [J]. 铁道标准设计,2018,62(5):37-39,44. DOI: 10.13238/j.issn.1004-2954.201708050002 [2] 李茂蛟. BIM技术在铁路信号工程设计中的应用研究 [J]. 铁道勘察,2020,46(1):144-149. DOI: 10.19630/j.cnki.tdkc.201909060014 [3] 陈 刚. 基于三维空间模型的铁路站场平纵横一体化设计软件研究 [J]. 铁路计算机应用,2017,26(10):28-31,48. DOI: 10.3969/j.issn.1005-8451.2017.10.009 [4] 安春兰. 铁路车站信号平面布置图的计算机辅助设计[D]. 成都: 西南交通大学, 2011. [5] 程耀东,潘永健,朱奕蓓,等. 高速铁路综合图自动生成关键技术研究 [J]. 铁道标准设计.,2015,59(10):42-45,53. [6] 付 强,袁 磊. 基于聚类分析及SVM的DMI机车信号自动识别 [J]. 铁路计算机应用,2015,24(8):46-49. DOI: 10.3969/j.issn.1005-8451.2015.08.013 [7] 黄孝章,刘双双. 铁路站场平面图CAD系统中图形信息的自动识别和提取方法 [J]. 交通与计算机,1998,16(2):53-57. [8] 张天祖,吕兴寿. 铁路站场平面图中主要元素的自动识别算法 [J]. 兰州交通大学学报,2013,32(3):124-127,163. DOI: 10.3969/j.issn.1001-4373.2013.04.027 [9] 王 飞. 基于图像处理和神经网络的站场状态信息识别方法 [J]. 铁道通信信号,2021,57(3):60-63. DOI: 10.13879/j.issn.1000-7458.2021-03.20513 [10] Lu Q C, Chen L, Li S, et al. Semi-automatic geometric digital twinning for existing buildings based on images and CAD drawings [J]. Automation in Construction, 2020(115): 103183. DOI: 10.1016/j.autcon.2020.103183
[11] Scheibel B, Mangler J, Rinderle-Ma S. Extraction of dimension requirements from engineering drawings for supporting quality control in production processes [J]. Computers in Industry, 2021, 129: 103442. DOI: 10.1016/j.compind.2021.103442
[12] Wen R, Tang W Q, Su Z Y. Topology based 2D engineering drawing and 3D model matching for process plant [J]. Graphical Models, 2017(92): 1-15. DOI: 10.1016/j.gmod.2017.06.001
[13] 李 锐. DXF建筑工程图的读取、识别与三维重建[D]. 天津: 天津大学, 2017. [14] 国家铁路局. 铁路工程制图图形符号标准: TB/T 10059-2015[S]. 北京: 中国铁道出版社, 2015. [15] Angelini P, Frati F, Kaufmann K. Straight-line rectangular drawings of clustered graphs [J]. Discrete & Computational Geometry, 2011, 45(1): 88-140.
[16] 朱文博,王小敏. 基于组合决策树的无绝缘轨道电路故障诊断方法研究 [J]. 铁道学报,2018,40(7):74-79. DOI: 10.3969/j.issn.1001-8360.2018.07.011 -
期刊类型引用(2)
1. 吕东,王婧,杨璟林,周清华,黄新文,赵博洋,薛宇腾. 基于WebGL引擎的铁路工程BIM+GIS平台研发及(设计阶段)应用. 铁道标准设计. 2023(10): 62-69 . 百度学术
2. 朱一. 基于BIM的铁路工程单元虚拟建造关键技术研究. 铁路计算机应用. 2023(10): 32-35 . 本站查看
其他类型引用(1)