Text mining technology of railway safety management information documents
-
摘要: 为了查找各安全管理信息报告之间的相关性,分析和利用此类报告文档丰富安全管理专业词库,文章分别采用卡方检验和朴素贝叶斯作为文本降维和分类的方法,对安全管理信息报告进行训练,形成算法模型,并利用训练模型对测试文档进行分类,测试结果准确率较高。Abstract: In order to find the correlation between the security management information reports, analyze and utilize this kind of report documents to enrich the professional word library of security management, this paper used the chisquare test and naive Bayes as the text reduction and classification method, carried out the training form calculation model of the security management information report, and used the training model to classify the test documents. The accuracy of test results is high.
-
Keywords:
- safety management /
- text mining /
- chi-square test /
- naive Bayes
-
-
[1] 李红亮. 铁路运输业国民经济贡献研究[D]. 武汉:武汉理工大学,2010. [2] 罗 浩,佘振国,宁 静. 铁路安全风险管控方法及应用研究[J]. 铁路计算机应用,2017,26(4): 40-43. [3] 赵 阳,徐田华. 基于文本挖掘的高铁信号系统车载设备故障诊断[J]. 铁道学报,2015,37(8):54-59. [4] 李 解,王建平,许 娜, 等. 基于文本挖掘的地铁施工安全风险事故致险因素分析[J]. 隧道建设, 2017, 37(2):160-166. [5] 杨连报,李 平,薛 蕊, 等. 基于不平衡文本数据挖掘的铁路信号设备故障智能分类[J]. 铁道学报,2018,40(2):59-66. [6] 李 擎, 张秋艳,白 磊. 一种基于文本挖掘的铁路基础设施设备风险隐患识别模型[J]. 铁路计算机应用,2018,27(2):1-4. [7] 檀敬东. 文本挖掘的若干关键算法研究[D]. 合肥:中国科学技术大学, 2010. [8] 吕超镇,姬东鸿,吴飞飞. 基于LDA 特征扩展的短文本分类[J]. 计算机工程与应用,2015, 51(4):123-127. [9] 机器学习:文本分类—朴素贝叶斯Bayes [EB/OL].[2015-01-12]. http://blog.csdn.net.
计量
- 文章访问数: 86
- HTML全文浏览量: 4
- PDF下载量: 65