• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

面向建设期铁路大数据的分级存储方法研究

廉小亲 杨凯 程智博 王万齐 吴艳华

廉小亲, 杨凯, 程智博, 王万齐, 吴艳华. 面向建设期铁路大数据的分级存储方法研究[J]. 铁路计算机应用, 2022, 31(2): 17-22. doi: 10.3969/j.issn.1005-8451.2022.02.04
引用本文: 廉小亲, 杨凯, 程智博, 王万齐, 吴艳华. 面向建设期铁路大数据的分级存储方法研究[J]. 铁路计算机应用, 2022, 31(2): 17-22. doi: 10.3969/j.issn.1005-8451.2022.02.04
LIAN Xiaoqin, YANG Kai, CHENG Zhibo, WANG Wanqi, WU Yanhua. Railway big data hierarchical storage method oriented to construction period[J]. Railway Computer Application, 2022, 31(2): 17-22. doi: 10.3969/j.issn.1005-8451.2022.02.04
Citation: LIAN Xiaoqin, YANG Kai, CHENG Zhibo, WANG Wanqi, WU Yanhua. Railway big data hierarchical storage method oriented to construction period[J]. Railway Computer Application, 2022, 31(2): 17-22. doi: 10.3969/j.issn.1005-8451.2022.02.04

面向建设期铁路大数据的分级存储方法研究

doi: 10.3969/j.issn.1005-8451.2022.02.04
基金项目: 中国铁道科学研究院集团有限公司院基金课题(2020YJ223)
详细信息
    作者简介:

    廉小亲,教授

    杨凯:杨 凯,在读硕士研究生

  • 中图分类号: U29 : TP39

Railway big data hierarchical storage method oriented to construction period

  • 摘要: 我国铁路网包含众多建设期和运营期路段,均会产生大量业务数据,然而传统的单节点大数据存储方式存在访问速度慢和时效性低等局限性,无法有效缓解数据存储压力。文章基于数据分级存储的思想,设计一种分布式大数据分级存储架构;综合考虑建设期铁路大数据的业务属性和存储数据库的固有属性,建立一套数据价值评价体系;基于专家评价法计算各数据表在不同评价维度下的价值,并通过K-means聚类算法判定各数据表相应的存储级别;以某建设期铁路大数据为实验样本进行验证,实验结果表明,文章提出的价值评价体系能够有效地对铁路建设期大数据进行存储级别判定,实现了面向建设期铁路大数据的分级存储。
  • 图  1  主流大数据分级存储架构

    图  2  铁路大数据分级存储架构

    图  3  建设期铁路大数据价值评价体系

    图  4  数据聚类结果分布情况

    图  5  数据价值分布情况

    表  1  四级指标专家评价结果(部分)

    四级指标
    进度质量安全投资环保其他统计汇总
    数据表名称数据表10001001
    数据表20000101
    数据表30100001
    数据表40001000
    数据表50010001
    数据表60000101
    数据表70010001
    数据表7210000011
    下载: 导出CSV

    表  2  四级指标分值专家打分结果

    指标名称进度质量安全环保其他统计汇总
    指标权值654211
    指标名称评估分析预警预测模型算法一级保密二级保密三级保密
    指标权值111543
    指标名称四级保密五级保密衍生数据表原始数据表5年以上4~5年
    指标权值212112
    指标名称3~4年2~3年2年以下字典表非字典表
    指标权值34120
    下载: 导出CSV

    表  3  三级指标数值计算结果

    数据表名称三级指标数值计算结果
    指标1指标2指标3指标4指标9指标10指标11
    数据表1331252195883
    数据表2432432499080
    数据表316231933150
    数据表42723129978111
    数据表541242732041
    数据表631242244826
    数据表717233195921
    数据表72134113104280266
    下载: 导出CSV
  • [1] 马小宁,李 平,史天运. 铁路大数据应用体系架构研究 [J]. 铁路计算机应用,2016,25(9):7-13. doi:  10.3969/j.issn.1005-8451.2016.09.003
    [2] 史天运,刘 军,李 平,等. 铁路大数据平台总体方案及关键技术研究 [J]. 铁路计算机应用,2016,25(9):1-6. doi:  10.3969/j.issn.1005-8451.2016.09.002
    [3] 王富章,吴艳华,卢文龙,等. 复杂艰险山区数字铁路总体方案研究 [J]. 中国铁路,2021(4):20-26.
    [4] 袁进俊. DOA下分布式DRC的元数据分级存储模型研究[D]. 成都: 成都理工大学, 2015.
    [5] EMC IP Holding Company LLC. Patent Issued foe Method And Device For Storage Management In A Hierarchical Storage System [J]. Journal of Engineering, 2020, 39(6): 610-615.
    [6] 汪恭书,董小琳,林郁钧,等. 川藏铁路建设工程物流管理特征与体系 [J]. 综合运输,2021,43(2):105-109.
    [7] 陈 润. 面向铁路运维的大数据流式处理技术的研究与应用[D]. 北京: 北京交通大学, 2017.
    [8] 郭 歌, 刘北胜, 李 慧, 等. 铁路基础设施多维数据模型框架研究[A] //中国智能交通协会. 第十五届中国智能交通年会科技论文集(2) [C]. 中国智能交通协会: 中国智能交通协会, 2020.
    [9] 王沛然,马小宁,王 喆,等. 铁路大数据服务平台存储架构设计与应用 [J]. 铁路计算机应用,2021,30(5):48-52. doi:  10.3969/j.issn.1005-8451.2021.05.011
    [10] 彭剑峰,徐保民,张义祥. 基于等保2.0的铁路敏感数据安全关键技术及研究 [J]. 网络安全技术与应用,2021(1):138-142. doi:  10.3969/j.issn.1009-6833.2021.01.078
    [11] 卢春房,蔡超勋. 川藏铁路工程建设安全面临的挑战与对策 [J]. 建设机械技术与管理,2020,33(2):28-34.
    [12] 吴 昊. 高速大容量固态存储系统设计[D]. 西安: 西安电子科技大学, 2010.
    [13] 许 诺. 数据分级存储结构与算法研究[D]. 昆明: 昆明理工大学, 2010.
    [14] 武瑞宏,许双安,何金学,等. 精密三角高程测量技术在川藏铁路建设中的应用 [J]. 铁道勘察,2021,47(2):18-22.
    [15] Teradata US Inc. Optimization Of Database Queries with Multiple Heterogeneous Database Systems [J]. Information Technology Newsweekly, 2020, 26(4): 1734-1738.
    [16] 裴学军. 专家评分评价法及应用 [J]. 哈尔滨铁道科技,2000(1):32.
    [17] Zgurovsky M Z, Zaychenko Y P. The cluster analysis in big data mining[M]. Cham: Springer, 2020.
    [18] 赵国伟,蔡江辉,杨海峰,等. 一种基于属性加权的快速聚类算法 [J]. 计算机与数字工程,2021,49(5):930-935. doi:  10.3969/j.issn.1672-9722.2021.05.013
图(5) / 表(3)
出版历程
  • 收稿日期:  2021-08-16
  • 刊出日期:  2022-03-08

目录

    /

    返回文章
    返回