Text mining technology of railway safety management information documents
-
摘要: 为了查找各安全管理信息报告之间的相关性,分析和利用此类报告文档丰富安全管理专业词库,文章分别采用卡方检验和朴素贝叶斯作为文本降维和分类的方法,对安全管理信息报告进行训练,形成算法模型,并利用训练模型对测试文档进行分类,测试结果准确率较高。Abstract: In order to find the correlation between the security management information reports, analyze and utilize this kind of report documents to enrich the professional word library of security management, this paper used the chisquare test and naive Bayes as the text reduction and classification method, carried out the training form calculation model of the security management information report, and used the training model to classify the test documents. The accuracy of test results is high.
-
Keywords:
- safety management /
- text mining /
- chi-square test /
- naive Bayes
-
-
[1] 李红亮. 铁路运输业国民经济贡献研究[D]. 武汉:武汉理工大学,2010. [2] 罗 浩,佘振国,宁 静. 铁路安全风险管控方法及应用研究[J]. 铁路计算机应用,2017,26(4): 40-43. [3] 赵 阳,徐田华. 基于文本挖掘的高铁信号系统车载设备故障诊断[J]. 铁道学报,2015,37(8):54-59. [4] 李 解,王建平,许 娜, 等. 基于文本挖掘的地铁施工安全风险事故致险因素分析[J]. 隧道建设, 2017, 37(2):160-166. [5] 杨连报,李 平,薛 蕊, 等. 基于不平衡文本数据挖掘的铁路信号设备故障智能分类[J]. 铁道学报,2018,40(2):59-66. [6] 李 擎, 张秋艳,白 磊. 一种基于文本挖掘的铁路基础设施设备风险隐患识别模型[J]. 铁路计算机应用,2018,27(2):1-4. [7] 檀敬东. 文本挖掘的若干关键算法研究[D]. 合肥:中国科学技术大学, 2010. [8] 吕超镇,姬东鸿,吴飞飞. 基于LDA 特征扩展的短文本分类[J]. 计算机工程与应用,2015, 51(4):123-127. [9] 机器学习:文本分类—朴素贝叶斯Bayes [EB/OL].[2015-01-12]. http://blog.csdn.net. -
期刊类型引用(5)
1. 李新琴,史天运,李平,代明睿,张晓栋. 基于文本的高速铁路信号设备故障知识抽取方法研究. 铁道学报. 2021(03): 92-100 . 百度学术
2. 高凡,王富章,张铭,赵俊华,李高科. 基于TF-IDF进化集成分类器的铁路安全故障文本分类. 电子技术应用. 2021(04): 71-76+81 . 百度学术
3. 田世润. 基于文本数据挖掘的复式交分道岔设备故障事件分析. 科技与创新. 2020(02): 74-75+77 . 百度学术
4. 谢文广,刘军,陈同喜,杨光,刘彦军. 铁路安全大数据分析平台研究. 铁路计算机应用. 2020(09): 21-25 . 本站查看
5. 李新琴,史天运,李平,王喆,杨连报. 基于进化集成分类器的铁路安全隐患智能分类. 交通信息与安全. 2019(02): 33-39 . 百度学术
其他类型引用(3)
计量
- 文章访问数: 86
- HTML全文浏览量: 4
- PDF下载量: 65
- 被引次数: 8