Research and development on Web-based 3D geographic information model management system
-
摘要: 数字孪生技术在我国各行业的应用正在加速推进,三维地理信息(简称:3D GIS)模型是数字孪生技术不可或缺的基础数据模型,开发具有自主知识产权的3D GIS模型管理平台的必要性不言而喻。参考开源地理信息框架Cesium,使用Java和JavaScript语言、开源代码及国产模型转换工具,开发基于Web的3D GIS模型管理系统,实现了LOD计算、模型合并与序列化、渲染优化、模型压缩与解压、场景漫游自定义控制等关键技术,能够将由无人机航拍的倾斜摄影像片转换为在Web浏览器中浏览的3D GIS模型,支持大容量3D GIS模型数据管理,方便用户高效完成场景编辑和模型渲染,提供安全、简便的数据共享接口,能够与其它信息系统无缝集成,为各类业务应用开发提供所需的数字孪生资源,方便各类业务应用以空间信息为载体整合相关数据,为业务提升赋能。Abstract: Today, the application of digital twinning technology in industries is accelerating. Since 3D geographic information (3D GIS) model is one of the indispensable basic data models of digital twinning technology, the necessity of developing 3D GIS model management platform with independent intellectual property rights is self-evident. By referring to the open source geographic information framework Cesium and using Java and JavaScript languages, open source code and domestic model conversion tools, the 3D GIS model management system based on Web is developed, and key technologies such as LOD calculation, model merging and serialization, rendering optimization, model compression and decompression, and customized control of scene roaming are realized. This system can convert oblique photograph taken by unmanned aerial vehicle into 3D GIS models browsed via Web browser, support large-volume 3D GIS model data management, facilitate users to efficiently complete scene editing and model rendering, provide safe and simple data sharing interface to enable seamless integration with other information systems. Besides, it can provide digital twin resources required for the development of various business applications and facilitate the integration of relevant data to empower business improvement by using spatial models as the carrier of various business applications.
-
随着我国铁路的高速发展,截至2022年底,全国铁路运营里程已达15.5万km,其中,高铁里程达到4.2万km。2022年,铁路货运总发送量达49.84亿t,铁路发送旅客量达到16.73亿人[1],铁路运输在我国经济发展中发挥着越来越重要的作用,铁路运输安全的重要性也愈发凸显。然而,铁路沿线行人、家畜、野生动物等侵入铁路线路的事件时有发生,威胁铁路行车安全。
目前,针对异物侵入界限(简称:侵限)检测的方法主要有电网检测法、光纤光栅检测法、视频检测法、雷达检测法、超声检测法和红外线屏障法等 [2]。这些方法的检测原理不同,适用的场景也不尽相同,其中,以视频检测法较为通用,使用该方法时,完全不需要对铁路线网进行任何设施改造。根据《铁路综合视频监控系统技术规范》[3],铁路沿线均建设有监控摄像头,并由专人24 h盯控,以便及时发现异物侵限等异常事件。由于这种方法监测的时空范围和防护能力有限,仍存在误报、依赖人工判识等问题[4],基于此,本文研究YOLOv5深度学习模型[5],针对铁路场景,对该模型进行适应性改进,并将其作为铁路异物侵限检测模型,检测铁路线路异物侵限情况,实现提高检测精确率的目的。
1 检测模型
1.1 YOLOv5模型网络结构
YOLOv5模型网络结构如图1所示,主要由主干(Backbone)网络、颈部(Neck)网络、头部(Head)网络组成。其中,Backbone网络采用较为轻量级的跨阶段局部网络(CSPDarknet,Cross Stage Partial Darknet)[6],提取目标特征,减少模型参数数量,在保证高精度的同时大幅减少了计算量;Neck网络采用路径聚合网络(PANet,Path Aggregation Network)[7],通过上采样和下采样操作实现多尺度特征的融合,构建特征金字塔网(FPNet,Feature Pyramid Network);Head网络对FPNet进行目标检测,输出检测结果。
1.2 铁路异物侵限检测模型
铁路异物侵限检测场景往往背景复杂多变、各类目标尺寸和形态差异较大、远小目标数量占比较大,并且真实目标样本数量过少。为了提高检测精度,本文主要在目标框损失函数和检测尺度方面对YOLOv5模型进行了适应性改进,以此作为铁路异物侵限检测模型。
1.2.1 目标框损失函数改进
YOLOv5模型使用CIoU损失函数作为目标框回归的损失函数,CIoU利用预测框和真实框之间的距离、重叠区域、宽高比等指标指导模型收敛。但是CIoU及GIoU等损失函数均未考虑预测框和真实框之间的方向性,大量“游离在外”的预测框对于模型收敛不能提供任何有效信息。因此,本文引入SIoU作为目标框损失函数[8],将预测框和真实框之间的位置关系加入到模型回归参数中,有效降低了预测框的自由度,使模型收敛速度更快,训练结果也更准确。
1.2.2 检测尺度改进
YOLOv5模型使用FPNet+PANet的方式提供3个尺度的特征图输出,以(像素为)640×640的图像输入为例,YOLOv5将输出3个像素分别为20×20、40×40、80×80的特征图。YOLOv5使用20×20的特征图检测大目标,通过2次上采样和拼接操作,进行特征融合,分别得到40×40、80×80的特征图,用于检测中等尺度的目标和小目标。
本文经过对相关数据集整理发现,在铁路异物侵限检测场景中,发生侵限的目标(如行人、动物等)在监控摄像机画面中的像素面积占比通常都较小,特别是发生在距离摄像机较远处的侵限,即便是YOLOv5提供的最大尺度(80×80)的特征图仍无法对远处的小型侵限目标进行精准检测。此外,现实场景中极少出现在画面中占比非常大的侵限目标,因此,YOLOv5提供的最小尺度(20×20)的特征图在本文场景中几乎没有实际作用。
基于上述考虑,本文对YOLOv5的检测尺度进行了适应性修改,通过增加一个额外的上采样和特征融合模块,获得尺度更大的特征图(160×160),能够检测到更远、更小的侵限目标。此外,还裁剪掉了原模型中作用不大、最小尺度为20×20的相关检测模块,减少了模型推理期间的计算量,提升模型推理速度。
改进后的模型网络结构如图2所示,图中,红色背景为本文新增的、更大尺度的检测模块,灰色连接箭头及模块为本文移除的检测模块。
改进后模型输出的3个尺度的特征图为40×40、80×80、160×160,分别用于检测大、中、小目标,能更好地适应铁路场景的异物侵限检测。
2 数据集构建
当前并没有专门针对铁路场景的行人和动物的图像数据(简称:数据)集,既有的公开数据集,如COCO等[9],缺乏铁路轨道及列车(特别是我国的各类高速动车组列车)背景,若将此类公开数据集直接用于铁路场景异物检测模型的训练,模型不能有效学习到铁路轨道相关场景特征,容易产生大量的误检和漏检。例如,基于此类数据集训练出来的检测模型极易将铁路扣件、铁路道外立杆、动车组列车部件等多种铁路常见场景误识为行人类型,而在铁路轨道中行走的行人(特别是夜间或者雨天)和动物则会产生较多的漏检。
因此,本文将通过多种途径采集铁路场景专用的异物侵限数据,并从公开数据集中挑选部分相关样本、辅以多种数据增强技术,构建一个更适合铁路场景的异物侵限数据集。
2.1 数据采集
本文从铁路综合视频监控平台中选取了60路运营中的铁路轨道旁的常规监控视频,包括有砟普速客、货运铁路,以及无砟高速铁路,涵盖桥梁、隧道口、隧道内等多种场景。根据实际使用需要,从选取的监控视频中采集了白天、夜间、阴天、晴天、雨天、雪天、雾天等多种条件下的数据,经过人工筛查,构建了含有6 000张样本的数据集,并对这些样本进行了标注。其中,5 500张样本中包含铁路轨道中行走的行人(主要是夜间上道作业的人员和部分经过居民聚居区的货运线路上行走的行人)及少量动物,剩余500张样本为不包含行人和动物的铁路轨道背景及各式列车背景,作为负样本使用。
真实线路中,能采集到的动物数据非常有限,远不足以满足模型训练要求。经过对铁路沿线异物侵限情况的调研、与铁路巡线人员及铁路综合视频盯控人员的沟通,最终选定了牛、羊、狗、猫、兔、鸡、松鼠、猴、狐狸、鹿等多种线路上较为常见的动物作为训练类别。针对其中的羊、鸡、猪等易发生侵限的动物,在铁路试验场地内按真实线路规格架设摄像机,以可控方式引入这些动物进行样本采集,共采集并标注了约500张包含行人和动物的样本。其他动物的数据由于获得性和可控性较差,不便进行现场采集,故通过公开数据集获取到这些动物的数据,通过技术手段叠加到此前采集的真实线路背景样本中,又生成了3 500张包含各类动物的铁路场景样本。
至此,本文共得到了10 000张包含铁路场景下的行人、常见动物、列车的样本。完成标注后,共有28 000个各类目标。
图3为本文采集和生成的部分样本图片示例。图3(a)为本文在铁路试验场地内采集的动物(羊、鸡)样本,图3(b)为真实铁路上采集的动物(猫、猴)侵限样本,图3(c)为使用本文方法将动物(狗、牛)素材叠加至铁路线路生成的样本。
2.2 数据增强
由于样本采集的设备数量和场景有限、各个场景相似度也略高,直接将上述数据用于模型训练,很容易产生过拟合,泛化能力较差。如果将来应用于训练集中未曾出现过的场景、或者采用像素值相差较大的摄像机进行拍摄,模型准确性可能会有所下降。因此,在模型训练前需要对数据集进行增强,提高数据集的丰富程度。
为提高模型泛化能力、减少过拟合现象的发生,本文使用改变图像的亮度、对比度、饱和度、色调,进行随机旋转、裁剪、翻转[10],增加额外噪声等技术对数据进行增强处理。通过此类数据增强技术可弥补数据采集设备型号、现场光照环境等的不足,从而更好地将模型应用于训练集之外的设备和场景。
此外,本文还使用Mosaic、Cutout、Mixup等数据增强技术,将多张样本进行随机缩放、裁剪、拼接,将多个目标集成于单张图像中,有效提升学习效率,同时,可随机将图像中的部分区域剪切,模拟目标被部分遮挡的情况,提高模型鲁棒性。图4为使用数据增强技术产生的部分用于训练的样本图片示例。
3 测试及结果分析
3.1 模型训练环境
本文进行模型训练使用的软、硬件配置如表1所示。
表 1 模型训练软、硬件配置配置项 参数/版本 CPU Intel(R) Xeon(R) W-2133 @ 3.60GHz GPU NVIDIA GeForce RTX 2080Ti(2块) 内存 32GB DDR4 操作系统 Ubuntu 18.04 LTS CUDA 11.2 Python 3.8 Pytorch 1.7 基于YOLOv5网络,初始学习率(learning rate)为0.001,使用Adam优化器,IOU阈值0.7,批大小(batch size)为64,启用了旋转、色调、饱和度、翻转、Mosaic、Cutout、Mixup等数据增强技术。模型训练共使用10 000张样本,按照8 : 1 : 1的比例划分为训练集、验证集、测试集。
3.2 模型指标评估
深度学习目标检测任务中,一般使用精确率(precision)、召回率(recall)、平均精度均值(mAP)等指标评估模型性能。其中,精确率表示在所有检出目标中真实目标的占比,精确率越高,代表错检率越低;召回率表示所有真实目标被检出的比例,召回率越高,代表漏检率越低。计算公式为
$$ P=\frac{TP}{TP+FP} $$ (1) $$ R=\frac{TP}{TP+FN} $$ (2) 式中,P为精确率,R为召回率,TP表示检测出的真实目标数量,FP表示检测出的错误目标数量,FN表示未被检出的目标数量。
精确率和召回率从两个不同的角度衡量模型性能,单独看任何一个指标都不足以评价模型的好坏,故引入了AP(Average Precision)概念,用于表述不同召回率下的平均精确率。而目标检测任务包含多个类别,对所有类别的AP取平均即得到评估指标mAP。
图5为模型训练过程中,训练集和验证集的损失函数曲线,包括目标框损失函数(box_loss)、目标置信度损失函数(obj_loss)、目标类别损失函数(cls_loss)。本文共训练了约250轮迭代(epoch),从损失函数曲线可以看到,模型训练约200轮后,验证集的各个损失值均已趋于平稳,不再有明显下降趋势。最终,采用训练250轮得到的模型文件进行后续试验。
图6为本文最终选择的模型在验证集上的精确率-召回率曲线(PR曲线,IoU阈值为0.5)。图中,灰色线条为各类别的PR曲线,蓝色线条为所有类别平均的PR曲线。根据PR曲线,模型所有类别最终平均精度(mAP)为0.863。
3.3 测试结果分析
使用本文训练得到的模型对测试样本中的铁路场景和非铁路场景的行人、动物数据进行检测。按行人、动物两大类别统计,本文训练模型在1 000张测试样本(含各类目标共2 713个)中的检测性能指标如表2所示。从表2的指标可以看到,模型在测试集上整体精确率为0.897左右、召回率为0.854左右,其中,行人的精确率和召回率均略高于动物的。部分检测结果如图7所示。
表 2 测试集检测结果类别 真实目标数 正检数
TP误检数
FP漏检数
FN精确率
P召回率
R行人 1 131 1 017 92 114 0.917 042 0.899 204 动物 1 582 1 301 173 281 0.882 632 0.822 377 所有类别 2 713 2 318 265 395 0.897 406 0.854 405 测试结果表明,模型能以较高的置信度检测出样本中的行人和动物,特别是对于真实线路夜间场景和图像质量较低的样本,本文模型也能取得较为理想的检测效果,模型具有良好的鲁棒性和充分的泛化能力。
4 结束语
针对异常侵入铁路股道、影响铁路运营安全的行人和常见动物,本文提出了基于深度学习的铁路异物侵入界限检测模型。该模型已在某客运专用线试用,多次检测出入侵动物,提高了铁路线路安全防护水平,同时,漏检率和误检率也较低,取得了较好的试用效果,满足铁路异物侵限检测要求。
-
[1] 童杨津,丁进选,赵文峰,等. 倾斜摄影在城市道路竣工测量中的应用分析 [J]. 科技创新与应用,2022,12(31):39-42. [2] 陶 飞,刘蔚然,刘检华,等. 数字孪生及其应用探索 [J]. 计算机集成制造系统,2018,24(1):1-18. [3] 郑之光. 基于Cesium的多源异构三维数据地理配准研究 [J]. 中阿科技论坛(中英文),2023(4):121-125. [4] 高亚伟. 基于开源引擎的三维场景基础平台搭建方法及实现 [J]. 测绘标准化,2023,39(1):22-26. [5] 许叙源. 基于Cesium的水陆融合三维场景构建研究 [J]. 广东水利水电,2023(2):80-83. [6] 刘 娇. 一种基于Cesium的公路数字孪生平 [J]. 中国科技信息,2023(4):90-91. [7] 李婷娜,田冬迪,董明泽. 基于Cesium实景三维共享服务的研究 [J]. 智能建筑与智慧城市,2022(6):46-48. [8] 丁田妹,徐发达. 三维模型中多层次细节LOD技术研究 [J]. 电子制作,2021(18):35-37. [9] 代欣位,郭甲腾,刘善军,等. 基于动态四叉树索引的三维地质模型组合剖切算法 [J]. 地理与地理信息科学,2020,36(4):8-13. [10] Dave Shreiner, Graham Sellers, John Kessenich. OpenGL编程指南(原书第8版)[M]. 北京: 机械工业出版社, 2016: 7-10. [11] khronos国际标准化组织. GLTF文件结构参考文档[EB/OL].https://registry.khronos.org/glTF/specs/2.0/glTF-2.0.pdf. [12] Scott McCarty. Why the world needs Wasm [J]. InfoWorld.com, 2022(9).
-
期刊类型引用(20)
1. 王震宇,武鹏,马露露,边原. 基于BIM参数化建模的接触网吊弦计算在京张高速铁路的应用研究. 铁道运输与经济. 2024(01): 67-73 . 百度学术
2. 许建国,刘杰,孟祥奎,李育冰,王恒,王敬渊. 高速铁路接触网工程数字化安装关键技术. 电气化铁道. 2024(01): 8-12+21 . 百度学术
3. 凌杰. 浅谈BIM技术在铁路接触网工程现场指导施工技术研究. 中国设备工程. 2023(08): 203-205 . 百度学术
4. 张毅. 基于BIM的接触网腕臂装配设计系统研究. 铁路计算机应用. 2023(04): 38-42 . 本站查看
5. 伊金浩,张毅,陈善乐,张鹏. 基于BIM技术的接触网三维数字化设计软件研究. 铁道标准设计. 2023(10): 171-178 . 百度学术
6. 耿肖,石瑞霞,赵传. 参数化驱动的接触网腕臂装配BIM建模方法. 铁路技术创新. 2022(01): 98-103 . 百度学术
7. 韩旻志,马强,董小兵. 基于三层架构的铁路信号BIM设计技术路线研究. 智能制造. 2022(05): 90-95 . 百度学术
8. 韩旻志. 基于三层架构的铁路信号BIM设计技术路线研究. 铁道标准设计. 2021(01): 149-153+159 . 百度学术
9. 邓梦. BIM技术在高速铁路接触网工程应用. 电子技术与软件工程. 2021(09): 193-194 . 百度学术
10. 何利江. 智能化接触网腕臂预配技术研究及应用. 交通世界. 2021(18): 6-7 . 百度学术
11. 梁崇亮,金光,乔锦新,李银生. 高速铁路接触网BIM设计研究与应用. 铁路技术创新. 2021(04): 32-36 . 百度学术
12. 黄鑫,鲁小兵. BIM技术在400km/h高速铁路接触网工程中的应用. 高速铁路技术. 2021(05): 102-106 . 百度学术
13. 靳辰琨,郭志光. 铁路四电工程建设BIM技术应用研究. 铁道标准设计. 2021(12): 110-115 . 百度学术
14. 杨文成. 基于BIM设计的道岔设备建模方法研究. 铁道勘察. 2020(01): 133-136 . 百度学术
15. 付逸群. BIM技术在南阳东站机电工程中的应用研究. 铁路计算机应用. 2020(02): 38-43 . 本站查看
16. 范少杰. 高速铁路精密工程测量技术标准的研究与运用. 工程技术研究. 2020(06): 69-70 . 百度学术
17. 吴积钦,杨佳,关金发,刘涛. 中国铁路接触网数字化发展策略与实践. 高速铁路技术. 2020(04): 21-27 . 百度学术
18. 符跃忠. 既有高铁线路接触网双线腕臂支柱更换设计方案研究. 中国建设信息化. 2020(18): 58-59 . 百度学术
19. 安蕾,杨斌,西穷. 基于BIM的京雄城际铁路接触网智能预配管理系统与应用. 铁道建筑技术. 2020(09): 30-34 . 百度学术
20. 谈敦龙. BIM技术在高速铁路接触网工程中的应用研究. 智能城市. 2020(24): 109-110 . 百度学术
其他类型引用(6)