Prediction method of railway faults duration based on convolutional neural network
-
摘要: 随着铁路网络复杂程度的不断提高,铁路运营部门调度难度日益增加,亟须研究精准预测铁路故障持续时间的方法,从而提高铁路调度系统应对各类风险和事故的能力。文章基于“安监报1”的文本数据,结合Jieba分词、Word2vec词向量模型等自然语言处理技术,构建了一种基于卷积神经网络(CNN,Convolutional Neural Network)的铁路故障持续时间预测模型,并基于中国铁路沈阳局集团有限公司的实际生成数据进行试验。试验结果表明,本预测模型能够较为快速、准确地获取铁路故障持续时间及其概率分布,为列车的运行调整提供参考。
-
关键词:
- 铁路故障持续时间 /
- 自然语言处理 /
- 卷积神经网络(CNN) /
- Word2vec /
- 安监报1
Abstract: With the continuous increase in the complexity of railway networks, the scheduling difficulty of railway operation departments is increasing. It is urgent to study methods for accurately predicting the duration of railway failures, in order to improve the ability of railway dispatch systems to cope with various risks and accidents. This paper was based on the text data of "Safety Supervision Report 1", combined with natural language processing techniques such as Jieba word segmentation and Word2vec word vector model, to construct a railway fault duration prediction model based on Convolutional Neural Network (CNN). The model was tested based on actual generated data from China Railway Shenyang Group Co. Ltd. The experimental results show that this prediction model can quickly and accurately obtain the duration and probability distribution of railway faults, and provide reference for train operation adjustment. -
中国铁路客票发售和预订系统(简称:客票系统)是国家关键信息基础设施,是铁路客运管理组织和旅客运输服务的核心支撑平台,提供旅客购票和出行全场景服务功能。自1996年研发建设以来,经过6次大的版本升级[1-2],已逐步建成由1个中国国家铁路集团有限公司(简称:国铁集团)级双活中心、18个铁路局集团公司(简称:铁路局)级中心,以及3 000多个车站组成的超大规模实时售票交易系统,提供人工窗口、自动售票机、电话、网站、客户端App等多种售票方式;支持现金、银行卡、网银及第三方支付等多种支付渠道;支持旅客持居民身份证、港澳台通行证等证件及手机动态二维码自助检/验票;提供互联网订餐、动车组选座、接续换乘、候补购票、铁路畅行会员服务等功能;实现覆盖售票全业务流程的管理、营销、统计、分析等应用功能。经过20余年的持续建设和应用,客票系统有力支撑了铁路客运快速发展,显著提升了旅客购票和出行体验,以及铁路客运管理和经营水平,并逐步成为以客票销售为核心的综合性服务系统[3-4]。
从全路范围分析,现有客票系统整体资源利用不均衡、部分环节高可用性和冗余性设计不足,业务数据分散冗余度高、数据同步环节多路径长,安全防护边界范围广、安全防护难度大,客票专网网络通道单一、建设运维成本高,软件架构不能适应快速调整和高频迭代的业务需求。据预测到2025年,铁路售票量将接近60亿张/年,客票系统目前的设计能力将无法满足要求,需要进一步优化系统和应用架构,提升系统处理能力和网络安全防护能力,提高持续应用交付能力和功能迭代效率,通过统一的平台化能力[5]支撑各项业务安全高质发展。
随着近年来国铁集团《新时代交通强国铁路先行规划纲要》《智能高速铁路体系架构》《“十四五”铁路网络安全和信息化规划》《数字铁路规划》等系列要求的提出,客票系统需要充分利用数字化、智能化等新技术开展7.0版本的研究和建设,构建具备一站式服务能力的综合票务服务平台[6],持续支撑客运部门管理水平和作业效率提升,不断满足旅客多样化、个性化的美好出行服务需求。
1 架构设计
为满足铁路客票业务发展和系统安全防护的需求,按照《“十四五”铁路网络安全和信息化规划》提出的建设多数据中心、共享网络逻辑通道、业务应用“集中部署”等要求,开展客票系统7.0架构优化设计。
1.1 总体架构
客票系统7.0依托国铁集团多数据中心实现两地三中心部署,优化双活中心架构,构建客票灾备中心,提升客票系统高可用能力;优化既有客票系统架构,取消铁路局级服务器,满足提升资源利用率、减少数据冗余、适应席位集中管理和收敛安全防护面的需要;调整客票专网共享铁路数据通信网,扩展终端设备可用的网络通道,提高基础通信网络资源利用率和网络可靠性,以达到降低建设成本、提升资源利用率的建设目标。优化后的客票系统7.0总体架构,如图1所示。
(1)优化双活中心架构
按照铁路信息化建设和网络安全建设要求,客票第一、第二生产中心业务迁移到国铁集团主数据中心和同城双活数据中心。单中心具备全量业务数据存储能力和业务处理能力,两中心间通过双向复制、增量备份等方式实现数据同步[7]。票务销售、出行服务、业务管理、收益管理、延伸服务、联运服务等业务采用双活方式运行,双活中心共同处理相关业务请求,单中心故障时,双活运行业务可由另一中心接管;决策分析和产品设计等业务采用主备方式运行,单中心故障时,业务可切换至另一中心运行。
(2)构建灾备中心系统
在国铁集团统建的异地灾备数据中心,对客票系统重要业务和数据进行容灾备份。灾备中心全量存储业务数据,按数据特征与双活中心间采用数据库逻辑复制或异步流复制技术实现业务数据和配置数据的同步。灾备中心日常可承担部分业务查询、统计分析等业务;当双活中心同时发生故障时,灾备中心可以降级接管处理票务销售、业务管理、出行服务、收益管理、延伸服务、联运服务等业务。
(3)取消路局级服务器
为提升系统资源整体利用率,缩小系统安全防护范围,简化数据管理和传输机制,路局不再设置服务器,既有路局中心的存根、席位等数据存储,窗口售退、验检票、计划管理、管理监控、收入统计、营销分析以及系统接口等应用服务,全部上移至国铁集团级。在国铁集团级数据中心搭建集中的窗口销售、验检票、业务管理和营销分析等业务服务集群,以及席位、基础数据等数据集群,承载既有路局和车站级客票系统的业务和数据,路局和车站终端直接接入国铁集团级客票系统。
1.2 网络架构
按照《“十四五”铁路网络安全和信息化规划》中提出的“将客票网广域网链路由独享传输专线改造为共享逻辑通道”的要求,结合带宽和可靠性、网络运维管理、应急能力等需求,开展网络架构设计,如图2所示。
(1)广域网设计
采用VPN技术将既有客票专网的传输网专线组网方式调整为铁路数据通信网组网,国铁集团两地三中心间的客票专网、客服内网、客服外网各网络平面通过OTN通道实现互联互通。
(2)局域网设计
细化分区分域设计,包括核心交换区、应用服务区、数据服务区、运维管理区、带外管理区、外部互联区、多中心互联区等,强化客票专网、客服内网、客服外网的统一接入管理。
(3)无线接入设计
路局、站段、列车的客票终端可通过运营商4G/5G移动网络(企业专线)、铁路5G-R移动网络连接至国铁集团级客票系统,满足日常客票终端作业需求。
(4)网络应急设计
充分利用三个数据中心间客票专网和OTN网络,铁路局和车站的客票专网和4G/5G无线网,实现网络故障时的应急切换,提升客票业务办理的连续性能力。
1.3 逻辑架构
为适应客票业务高速发展,提高业务服务复用能力和数据管理能力,实现应用功能的快速迭代,客票系统7.0基于“纵向解耦、横向融合”的设计原则,重构既有客票系统,设计覆盖全渠道业务的“六层级、两体系”的逻辑架构,如图3所示。构建“平台服务+系统应用”业务生态[8],提升业务服务、数据服务、新技术融合、平台共享开放及业务追溯等方面的能力,推动客票业务数字化、智能化升级。
(1)硬件支撑平台
硬件支撑平台提供硬件基础资源服务能力。根据海量访问、大流量、高并发、实时响应、高可靠等客票业务特点,以及技术多样化、自主化的需求,综合运用成熟的集群化、虚拟化、容器化等技术,利用信创产品和国产化软/硬件产品,构建适应不同业务应用场景的存储资源池、计算资源池、网络资源池和安全资源池,实现基础资源的高效管理。
(2)技术支撑平台
技术支撑平台为集中处理架构提供基础技术能力,包括统一终端框架、统一接入平台、数据调度与同步平台等适应业务发展的集中处理平台,以及分布式计算、大数据处理、新技术应用和软件运行环境等基础技术框架,实现客票系统的数据存储和中间件服务能力,从而提升应用开发效率和管控水平。
(3)服务赋能平台
服务赋能平台基于既有客票系统的交易服务集成平台和数据共享集成平台构建,包括基于领域驱动设计理念的原子服务构建的业务赋能平台、多数据服务支撑的数据赋能平台,以及多算力共享与调度的人工智能(AI,Artificial Intelligence)赋能平台,提供业务、数据和AI的共享服务能力。
(4)服务中心
重构既有客票系统的业务功能,构建集中统一的服务中心。设计票务销售、业务管理、出行服务、联运服务、延伸服务、产品设计、决策分析、收益管理8项业务领域应用,实现客运服务从产品设计、生产、管理、销售,到运营分析、收益管理的全生命周期、全场景覆盖。
(5)渠道应用与服务用户
客票系统用户包括旅客、铁路内客运专业用户、铁路内相关专业部门、铁路外相关企业等。面向旅客的渠道应用包括12306网站、12306App、公众号、电话订票、人工坐席应用等,面向内部用户的渠道应用包括窗口应用、手持移动终端应用等。
(6)体系构建
按照客票业务研发、系统运维、安全保障一体化要求,设计网络安全防护技术体系和研发运维技术体系,支撑客票系统7.0安全、稳定、高效运行。
2 网络安全防护技术体系设计
以网络安全等级保护为主线、关键基础设施保护为重点、重要数据和个人信息保护为核心、应用服务保护为关键、国产商用密码应用为基础,设计覆盖客服外网、客服内网和客票网,由安全基础资源层、安全防护层、安全治理层、辅助指挥层组成的“三网四层一体化”网络安全防护体系,涵盖安全物理环境、安全通信网络、安全区域边界、安全计算环境、安全管理中心等方面,实现分网分区分域边界防护、网络层面和逻辑层面纵深防护、被动防御和主动防护相结合的动态演化智能防护。构建客票系统7.0 安全保障技术体系,如图4所示。
2.1 网络安全等级保护
依据《信息安全技术 网络安全等级保护基本要求》GB∕T 22239等等级保护相关要求,分别对12306网系统、客票系统开展网络安全等级保护建设工作。在确保物理环境安全的基础上,遵循“一个中心,三重防护”的纵深防御理念,构建网络安全等级保护技术体系。
2.2 关键信息基础设施保护
依据《信息安全技术 关键信息基础设施安全保护要求》GB/T 39204等关基保护相关要求,在等级保护的基础上,从分析识别、安全防护、检测评估、监测预警、主动防御、事件处置六个方面进行增强性重点保护。
2.3 数据安全和个人信息安全保护
依据《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《网络安全标准实践指南》《信息安全技术 个人信息安全规范 》GB∕T 35273-2020 《信息安全技术 网络数据处理安全要求》GB∕T 41479-2022等对数据安全和个人信息安全保护的相关要求 ,采用多层次的数据安全技术,保障数据和个人信息在数据处理活动中各环节的安全。
2.4 国产商用密码应用
依据《信息安全技术 信息系统密码应用基本要求》GB∕T 39786等密码应用相关要求,部署国产商用密码设备,开展数据保护、密码管理等工作,同步完善密码管理,包括公钥基础设施PKI和对称密钥管理。
3 研发运维技术体系设计
为了在数字化新形势下打造更为智能高效的研发运维体系,客票系统7.0设计提出按照“集中管理、协同研发、统一运维”的目标,满足从需求到交付的全链路工具打通、项目流程端到端的全周期管理、低代码开发与自动化测试等需求,构建标准化、容器化、自动化、智能化的研发运维管理平台,降低团队沟通成本,提升研发运维效能,实现以数据驱动的人、流程、工具一站式研发运维新模式。研发运维平台按照安全等级防护要求,部署在国铁集团两地三中心的客服外网、客服内网、客票网及研发测试环境中,研发运维体系如图5所示,包括容器管理、研发管理、监控管理和应急管理等。
3.1 容器管理
容器管理为业务应用提供多租户、资源隔离的基础运行环境,为研发运维平台提供敏捷开发、测试的基础功能,满足业务应用按需进行资源限额、资源隔离、弹性伸缩、持续交付的需求,提升研发运维平台持续集成、持续反馈、持续响应的能力。
3.2 研发管理
以实现研发流水线为目标,在知识库、排期管理、版本管理等研发支撑的基础上,实现敏捷开发,提供包括需求、设计、开发、测试、交付的全流程管理。
3.3 监控管理
监控管理包括业务运维、监控配置、数据采集、异常诊断、根因分析、告警通知、日志采集、流式计算、可视化展示、链路跟踪等。
3.4 应急管理
应急管理分为展示层、管理层和响应层。展示层是面向应急人员的可视化操作层,包括平台门户、应急管理大屏;管理层对应急过程中的预案、事件、策略进行管理;响应层按照应急管理流程,进行应急发现、辅助决策、应急处置、应急恢复、分析总结和应急预测等。
4 结束语
文章以建设交通强国、铁路先行为指导思想,以满足旅客日益美好出行服务需求为目标,从架构设计、网络安全防护技术体系、研发运维技术体系三方面详细阐述了客票系统7.0建设的重点内容,即通过优化架构提升系统处理能力,通过建设网络安全防护技术体系提升安全保障防护能力,通过完善研发运维技术体系实现研发运维一体化,进而支撑打造能力开放、资源共享、安全高效的综合票务服务平台。
客票系统7.0的建设是一个漫长艰巨的过程,既要持续完善系统功能支撑现有业务需求,还需稳步重构核心业务满足未来发展需要,最终实现信创软硬件的全面应用。目前,国铁集团正在有序推进客票系统7.0的信息化项目和工程,系统建成后将支撑铁路旅客服务智慧化、业务管理数字化、收益经营智能化、综合出行一体化的客运服务高质量发展,助力构建服务智慧、舒适便捷、旅客满意的客运服务体系,让旅客出行更加美好。
-
表 1 “安监报1”实验数据样例
“安监报1”数据 XXX次于17时30分时运行至辽阳高速场至沈阳南站间接触网挂风筝,经随车机械师检查确认风筝挂在7车受电弓上,更换2车受电弓后
于17时47分开车。XXX次列车运行至阜新站至黑山北站间XXX处撞野鸡,17时02分黑山北站
停车检查,经随车机械师下车检查无异常后17时08分开车,影响本列
超站停4 min。表 2 故障持续时间类别
标签编号 时间范围/min 0 (0, 5) 1 [5, 30) 2 [30, 60) 3 [60, 180) 4 [180, +∞) 表 3 卷积神经网络参数配置表
参数名 参数值 卷积核个数 256 卷积核大小 3 嵌入层维度 100 单词训练数据个数 256 轮次 24 验证集比例 0.2 丢弃率 0.3 激活函数 Softmax 池化方式 MaxPool 表 4 预测结果样例
安监报数据 类别0 类别1 类别2 类别3 类别4 XXX次于17时30分时运行至辽阳高速场至沈阳南站间接触网挂风筝,经随车机械师
检查确认风筝挂在7车受电弓上,更换2车受电弓后于17时47分开车。0.075 0.820 0.078 0.025 0.001 XXX次列车运行至阜新站至黑山北站间XXX处撞野鸡,17时02分黑山北站停车
检查,经随车机械师下车检查无异常后17时08分开车,影响本列超站停4 min。0.153 0.003 0.025 0.780 0.038 -
[1] Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their compositionality[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems, 5-10 December, 2013, Lake Tahoe Nevada. Red Hook, USA: Curran Associates Inc. , 2013.
[2] Mikolov T, Chen K, Corrado G, et al. Efficient estimation of word representations in vector space[J]. arXiv preprint arXiv: 1301, 3781: 2013.
[3] Kalchbrenner N, Grefenstette E, Blunsom P. A convolutional neural network for modelling sentences[C]//Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, 22-27 June, 2014, Baltimore, MD, USA. Baltimore: ACL, 2014.
[4] 吴龙峰. 基于Word2vec和LDA的卷积神经网络文本分类模型[J]. 电脑知识与技术,2019,15(22):203-204,206. DOI: 10.14004/j.cnki.ckt.2019.2755 [5] 牛雪莹. 结合主题模型词向量的CNN文本分类[J]. 计算机与现代化,2019(10):7-10. DOI: 10.3969/j.issn.1006-2475.2019.10.002 [6] 张浩然,谢云熙,张艳荣. 基于TextCNN的文本情感分类系统[J]. 哈尔滨商业大学学报(自然科学版),2022,38(3):285-292. [7] Rosadini B, Ferrari A, Gori G, et al. Using NLP to detect requirements defects: an industrial experience in the railway domain[C]//Proceedings of the 23rd International Working Conference on Requirements Engineering: Foundation for Software Quality, 27 February –2 March, 2017, Essen, Germany. Cham: Springer, 2017: 344-360.
[8] 樊梦琳. 铁路事故持续时间预测方法研究[D]. 北京:北京交通大学,2020. [9] 张世同. 基于BERT与BiLSTM的铁路安监文本分类方法[J]. 现代计算机,2021(22):38-42.