• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

普速铁路桥梁设备缺陷文本分类模型研究

郭心全, 李俊波, 沈鹍, 吴霞, 李林

郭心全, 李俊波, 沈鹍, 吴霞, 李林. 普速铁路桥梁设备缺陷文本分类模型研究[J]. 铁路计算机应用, 2024, 33(12): 14-18. DOI: 10.3969/j.issn.1005-8451.2024.12.03
引用本文: 郭心全, 李俊波, 沈鹍, 吴霞, 李林. 普速铁路桥梁设备缺陷文本分类模型研究[J]. 铁路计算机应用, 2024, 33(12): 14-18. DOI: 10.3969/j.issn.1005-8451.2024.12.03
GUO Xinquan, LI Junbo, SHEN Kun, WU Xia, LI Lin. Text classification model for bridge equipment defect of ordinary railway[J]. Railway Computer Application, 2024, 33(12): 14-18. DOI: 10.3969/j.issn.1005-8451.2024.12.03
Citation: GUO Xinquan, LI Junbo, SHEN Kun, WU Xia, LI Lin. Text classification model for bridge equipment defect of ordinary railway[J]. Railway Computer Application, 2024, 33(12): 14-18. DOI: 10.3969/j.issn.1005-8451.2024.12.03

普速铁路桥梁设备缺陷文本分类模型研究

基金项目: 中国铁道科学研究院集团公司科研项目(2023YJ131)
详细信息
    作者简介:

    郭心全,助理研究员

    李俊波,正高级工程师

  • 中图分类号: U445.7 : TP39

Text classification model for bridge equipment defect of ordinary railway

  • 摘要:

    为解决普速铁路桥梁设备缺陷采集效率低下的问题,提高现场检查作业效率,提出一种融合预训练模型RoBERTa-wwm-ext、双向长短时记忆网络和注意力机制的模型(简称:改进BiLSTM-Att模型),即普速铁路桥梁设备缺陷文本分类模型。采用该模型,以圬工桥缺陷部位(桥面、支座、墩台、梁拱、桥渡水文、附属设施)缺陷文本分类为目标,对15个铁路局集团公司的普速铁路圬工桥设备缺陷描述文本数据进行了实验验证。结果表明,改进BiLSTM-Att模型的精确率、召回率和F1值均达到了90%以上,相对于对比模型,这些指标均有显著提高;改进BiLSTM-Att模型可有效识别桥梁设备缺陷,辅助现场桥梁设备检查作业。

    Abstract:

    To solve the problem of low efficiency in defect collection of ordinary railway bridge equipment and improve the efficiency of on-site inspection operations, this paper proposed a model that integrated pre-trained model RoBERTa wwm ext, bidirectional long short-term memory network, and attention mechanism (referred to as the improved BiLSTM Att model), namely the text classification model for bridge equipment defect of ordinary railway. It adopted the model and aimed to classify the defect text of the masonry bridge defect parts (bridge deck, bearings, piers and abutments, beam arches, bridge crossing hydrology, ancillary facilities). Experimental verification was conducted on the defect description text data of 15 railway group companies' ordinary railway masonry bridge equipment. The results indicate that the accuracy, recall, and F1 score of the improved BiLSTM Att model have all reached over 90%, and these indicators have significantly improved compared to the comparative model. The improving BiLSTM Att model can effectively identify defects in bridge equipment and assist in on-site bridge equipment inspection operations.

  • 图  1   改进BiLSTM-Att模型结构

    图  2   普速铁路桥梁设备缺陷文本分类模型实现步骤

    图  3   改进BiLSTM-Att模型混淆矩阵

    表  1   数据清洗后部分数据

    缺陷部位 缺陷描述(清洗前) 缺陷描述(清洗后)
    桥面 人行道L板少量破损漏筋20块,1480×300×300 mm18块,980×240×300 mm2块 人行道 板少量破损漏筋 块 块 块
    支座 9#墩③、④、⑤、⑥、⑦、⑧号支座上座板均向天方偏移10 mm。 墩号支座上座板均向天方偏移
    墩台 1152墩拉侧水平裂纹一条长4.2 m宽0.8 mm,并泛碱5 ㎡ 墩拉侧水平裂纹一条长宽并泛碱
    梁拱 3#墩左侧梁缝上下翼缘顶死,下翼缘梁体横裂1条11 cm×0.1 mm梁体混凝土轻微掉块8×3×1 cm 墩左侧梁缝上下翼缘顶死下翼缘梁体横裂条梁体混凝土
    轻微掉块
    桥渡水文 桥梁1#~4#护锥,坡面长杂草。 桥梁护锥坡面长杂草
    附属设施 16#墩右侧抗震桩底部鼓起开裂带起墩帽面空鼓1.3 ㎡ 墩右侧抗震桩底部鼓起开裂带起墩帽面空鼓
    下载: 导出CSV

    表  2   各类别数据量

    类别 桥面 支座 墩台 桥渡水文 附属设施 合计
    数量/条 40081 11731 11930 11011 30788 132360
    下载: 导出CSV

    表  3   各模型实验结果对比

    模型 精确率 召回率 F1值
    Word2Vec-TextCNN 89.70% 89.70% 89.65%
    Word2Vec-TextRCNN 89.01% 88.64% 88.70%
    Word2Vec-TextBiLSTM 89.39% 89.41% 89.38%
    Word2Vec-TextBiLSTM-Att 89.79% 89.84% 89.80%
    RoBERTa-wwm-ext+BiLSTM-Att 90.79% 90.74% 90.72%
    下载: 导出CSV

    表  4   改进BiLSTM-Att模型各类别实验结果对比

    类别 精确率 召回率 F1值
    桥面 91.77% 92.23% 92.00%
    支座 96.01% 94.94% 95.48%
    墩台 89.01% 78.61% 83.49%
    梁拱 93.75% 94.07% 93.91%
    桥渡水文 92.07% 89.70% 90.87%
    附属设施 85.15% 89.36% 87.20%
    下载: 导出CSV
  • [1] 新时代交通强国铁路先行规划纲要[N]. 人民铁道,2020-08-13(002).
    [2] 郭心全,李 林,沈 鹍,吴 霞. 铁路桥隧养护作业智能终端设计与应用[J]. 铁路计算机应用,2023,32(2):28-33.
    [3] 杨连报,李 平,薛 蕊,等. 基于不平衡文本数据挖掘的铁路信号设备故障智能分类[J]. 铁道学报,2018,40(2):59-66. DOI: 10.3969/j.issn.1001-8360.2018.02.009
    [4] 周庆华,李晓丽. 基于MCNN的铁路信号设备故障短文本分类方法研究[J]. 铁道科学与工程学报,2019,16(11):2859-2865.
    [5] 韩 广,卜 桐,王明明,等. 基于双通道双向长短时记忆网络的铁路行车事故文本分类[J]. 铁道学报,2021,43(9):71-79. DOI: 10.3969/j.issn.1001-8360.2021.09.010
    [6]

    Herzog T H, Scheuren F, Winkler W E. Record linkage[J]. Wiley Interdisciplinary Reviews: Computational Statistics, 2010, 2(5): 235-543.

    [7]

    Cui Y M, Che W X, Liu T, et al. Pre-training with whole word masking for Chinese BERT[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, 29: 3504-3514.

    [8]

    Liu Y H, Ott M, Goyal N, et al. RoBERTa: a robustly optimized BERT pretraining approach[J]. arXiv: 1907.11692, 2019.

    [9] 杨 丽,吴雨茜,王俊丽,等. 循环神经网络研究综述[J]. 计算机应用,2018,38(S2):1-6,26.
    [10] 安 锐,陈海龙,艾思雨,等.基于BERT-LSTM模型的航天文本分类研究[J/OL].哈尔滨理工大学学报,1-10

    2024-5-21

  • 期刊类型引用(5)

    1. 景辉,戴琳琳,候亚伟,朱宇豪,随玉腾. 基于光照自适应调节和模糊分类的人脸图像质量提升算法研究. 铁路计算机应用. 2023(02): 1-6 . 本站查看
    2. 吕占民,李士达,戴琳琳,宋春晓,董兴芝. 基于AR智能眼镜的免打扰列车验票应用研究. 铁路计算机应用. 2023(05): 64-67 . 本站查看
    3. 单杏花,张志强,宁斐,李士达,戴琳琳. 中国铁路电子客票关键技术应用与系统实现. 中国铁道科学. 2021(05): 162-173 . 百度学术
    4. 赵耀. 多技术融合的大流量智能测温系统设计与实现. 铁路计算机应用. 2021(09): 31-34 . 本站查看
    5. 周敏. 多技术融合的综合交通枢纽智能停车系统. 铁路计算机应用. 2021(09): 27-30 . 本站查看

    其他类型引用(4)

图(3)  /  表(4)
计量
  • 文章访问数:  34
  • HTML全文浏览量:  23
  • PDF下载量:  10
  • 被引次数: 9
出版历程
  • 收稿日期:  2024-05-20
  • 刊出日期:  2024-12-24

目录

    /

    返回文章
    返回