• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

一种基于文本挖掘的铁路基础设施设备风险隐患识别模型

李擎, 张秋艳, 白磊

李擎, 张秋艳, 白磊. 一种基于文本挖掘的铁路基础设施设备风险隐患识别模型[J]. 铁路计算机应用, 2018, 27(2): 1-4.
引用本文: 李擎, 张秋艳, 白磊. 一种基于文本挖掘的铁路基础设施设备风险隐患识别模型[J]. 铁路计算机应用, 2018, 27(2): 1-4.
LI Qing, ZHANG Qiuyan, BAI Lei. Text mining based identification model for railway infrastructure risk[J]. Railway Computer Application, 2018, 27(2): 1-4.
Citation: LI Qing, ZHANG Qiuyan, BAI Lei. Text mining based identification model for railway infrastructure risk[J]. Railway Computer Application, 2018, 27(2): 1-4.

一种基于文本挖掘的铁路基础设施设备风险隐患识别模型

基金项目: 国家自然科学基金(51578057); 中国铁路总公司重点课题 (2017T003-C)
详细信息
    作者简介:

    李 擎,在读博士研究生;张秋艳,讲师。

  • 中图分类号: U216.42:TP39

Text mining based identification model for railway infrastructure risk

  • 摘要: 提出一种基于文本挖掘的铁路基础设施设备风险隐患识别模型,该模型采用基于层叠隐马尔科夫的分词算法对长文本形式的设备质量问题数据进行分词处理,在此基础上,统计每类词出现的频度,识别铁路基础设施设备管理风险隐患,利用词云图可视化技术,对分析结果进行直观、清晰地展示。作者选取了兰州铁路局2012年1月~2016年4月期间4 662条工务、电务和供电专业的铁路基础设施设备质量问题数据,验证了模型的有效性。
    Abstract: A text mining based identification model for railway infrastructure risk was proposed in this paper. The model used segmentation algorithm based on Cascaded Hidden Markov Model (CHMM) to deal with data in the form of long text, which recorded railway infrastructure quality problems. Then, the word frequency was calculated and the railway infrastructure management risk was identified. The analysis result was intuitively and clearly displayed by using the visualization technology of word cloud. The proposed model was experimentally verified by using 4 662 records of railway infrastructure quality problems in Lanzhou Railway Administration between January 2012 to April 2016.
  • [1] Berry M W, Castellanos M.Survey of text mining II: Clustering, classification, and retrieval[M]. New York: Springer, 2008.
    [2] 陈勇跃, 田文芳, 吴金红. 主题领域研究热点跟踪及趋势预测的可视化分析方法研究[J]. 情报理论与实践,2017(6):117-121.
    [3] 陈苗,刘超,庄俊玲,等. 基于文本挖掘的临床带教评价分析[J]. 中国卫生统计,2017(1):59-60.
    [4] 史玉珍,吕琼帅. 基于进化模糊规则的Web新闻文本挖掘与分类方法[J]. 湘潭大学自然科学学报,2016,38(2):99-103.
    [5] 蔡溢,杨洋,殷红梅. 基于ROST文本挖掘软件的贵阳市城市旅游品牌受众感知研究[J]. 重庆师范大学学报:自然科学版,2015(1):126-134.
    [6] 杨张博,高山行. 基于文本挖掘和语义网络方法的战略导向交互现象研究—以生物技术企业为例[J]. 科学学与科学技术管理,2015(1):139-150.
    [7] 韩冬煦,常宝宝. 中文分词模型的领域适应性方法[J]. 计算机学报 ,2015,38(2):272-281.
    [8] 刘群, 张华平,俞鸿魁,等. 基于层叠隐马模型的汉语词法分析[J]. 计算机研究与发展,2004(8):1421-1429.
    [9] Viterbi A J.Error bounds for convolutional codes and an asymptotically optimum decoding algorithm[J]. IEEE Transactions on Information Theory, 1967,13(2):260-269.
    [10] 郭曙纶. 汉语语料库应用教程[M]. 上海:上海交通大学出版社,2013.
    [11] Afzal S, Maciejewski R, Yun J, et al.Spatial Text Visualization Using Automatic Typographic Maps[J]. IEEE Transactions on Visualization & Computer Graphics, 2012,18(12): 2556-2564.
    [12] R Core Team. R: A Language and Environment for Statistical Computing[EB/OL].[2014-04-09].http:// www.R-project.org/.
  • 期刊类型引用(4)

    1. 张雯柏,彭翠云,张立都,胡爱云. 铁路信号集中监测智能分析与故障诊断测试脚本系统设计与实现. 铁路计算机应用. 2020(01): 71-76 . 本站查看
    2. 宇文远. 铁路信号故障诊断专家系统研究. 中国新技术新产品. 2019(06): 46-47 . 百度学术
    3. 朱文钊. 软件故障树和专家系统在航电软件测试中的应用. 电子技术与软件工程. 2019(16): 54-55 . 百度学术
    4. 宋爽,刘伯鸿,周科,陈跃东. 一种基于时间自动机模型的区域控制器测试序列生成方法. 铁道标准设计. 2018(08): 168-173 . 百度学术

    其他类型引用(2)

计量
  • 文章访问数:  56
  • HTML全文浏览量:  13
  • PDF下载量:  35
  • 被引次数: 6
出版历程
  • 收稿日期:  2017-10-25
  • 刊出日期:  2018-02-24

目录

    /

    返回文章
    返回