Construction of knowledge graph of railway dispatching emergency plan
-
摘要: 为解决铁路调度应急预案信息整合困难、综合管理能力不足的问题,采用知识图谱概念和方法,对铁路调度应急预案相关信息资源进行全面梳理和系统分析,采用自顶向下与自底向上相结合的方法,完成铁路调度应急预案知识图谱的构建;提出铁路调度应急预案主要实体概念及其属性与关系的定义,研究数据抽取、数据融合及知识存储的方法,实铁路调度应急预案数据的规范、有序存储。以雾天行车场景为例,开展应用探索。应用表明,知识图谱为整合多源异构的铁路调度应急预案相关信息资源提供了有力工具,使应急预案相关信息资源的使用更加便利化,更好地支持应急指挥快速决策,支持应急处置工作从容有序开展。Abstract: To address the difficulties in information integration and insufficient of comprehensive management ability of railway dispatching emergency plan, The concept and approach of knowledge graph is employed to sort and analyze relevant information resources of railway dispatching emergency plan. Using a combination of top-down and bottom-up method, the knowledge graph of railway dispatching emergency plan is constructed, in which the core elements of railway dispatching emergency plan are indentified and their properties and associations are defined. Besides, the methods of data extraction, data fusion and knowledge storage are studied to realize standardized and orderly organization and storage of railway dispatching emergency plan data. Taking train operation in foggy weather as a study case, the application of the knowledge graph of railway dispatching emergency plan is explored. The application shows that knowledge graph can be a powerful tool for integrating multi-source and heterogeneous related information resources of railway dispatching emergency plan and facilitate the utilization of those resources and better support rapid decision-making in emergency command and and support emergency response rolling out in a calm and orderly manner.
-
铁路调度应急预案是铁路调度应急指挥的指导性方案,是铁路调度人员应对突发事件的行动指南。铁路调度应急预案管理水平关系调度应急指挥的效率及应急处置的成效。铁路应急处置大多是由多工种业务人员共同参与、配合完成,但全面掌握相关业务知识的专业人员极少,导致应急预案编制缺乏系统性;另一方面,现有的铁路调度应急预案对多源应急信息资源缺乏系统梳理和有效组织,造成相关信息资源整合困难,制约了铁路调度应急预案管理能力。
目前,国内针对铁路应急预案数字化方案已开展了一些研究。文献[1]提出融合本体与深度学习的应急预案数字化方法,运用深度学习算法,从应急事件消息文本中提取关键信息,并用本体方法对事件处理流程进行分析和梳理,自动生成数字化铁路应急预案;文献[2] 研究提取应急预案指定要素核心内容的数字化预案转化方法,利用工作流引擎实现应急预案编写、评审、发布、使用、修订、废止的全生命周期管理,提高应急预案的适用性与可操作性。
知识图谱(Knowledge Graph)本质上是一种揭示实体之间关系的语义网络,为海量、异构、动态数据的表达、组织、管理及利用提供一种非常有效方式,可快速、准确地实现信息关联搜索。目前,知识图谱广泛地应用于医疗、政务、电商、金融等领域,为智能问答、商品推荐、金融风险识别等提供实用工具。文献[3]通过语义匹配、图神经网络、路径多跳、逻辑多跳等知识图谱多跳问答推理方法,研究智能问答的解决方式;文献[4]提出“预训练+知识向量服务”模式,设计知识图谱预训练模型,极大地提高了商品分类、同类商品挖掘、商品推荐等应用的性能;文献[5]通过图分析、图挖掘等技术,发现深层风险关联,增强风险账户识别能力。
本文研究运用知识图谱概念和方法,结合铁路应急救援场景,对铁路调度应急预案所涉及的多源信息资源进行分析和整合,实现相关信息的关联存储与有序组织,为铁路调度应急预案的综合展示与规范化管理提供有利条件。
1 知识图谱概念及构建方法
1.1 知识图谱概念简介
知识图谱采用可视化方式,系统、形象地展示领域知识的整体框架、核心概念实体及其关联关系,是一种综合应用数学、图形学、信息可视化技术、信息学等学科的理论方法。
知识图谱是由节点和边组成的图,节点表示各个知识点,边是知识点之间的关联关系,形成网状知识结构,能够显式、直观地表达知识的关联关系,可有效避免信息遗漏,也便于快速检索相关知识。
通常,知识图谱采用图数据库实现领域知识的关联存储,相较于关系型数据库,图数据库更适于构建复杂关系网络,使机器具备认知、理解领域知识的能力,实现智能解决业务问题的目的。
1.2 知识图谱的一般构建方法
知识图谱的构建过程主要包括知识抽取、知识融合、知识存储3个步骤,从多源信息中抽取概念、属性、关系,并封装成知识单元,融合语义表达不同但表示同一对象的概念、属性,将整理的知识及其关联存储为图。一般将知识图谱划分为实体层和数据层2个层面,采用自顶向下和自底向上相结合的方法进行构建,基本流程如图1所示。
2 铁路调度应急预案知识图谱构建过程
依照知识图谱的一般构建方法,铁路调度应急预案知识图谱构建过程为:先识别出铁路调度应急预案涉及的相关实体概念,定义其属性及其关系,然后完成铁路调度应急预案数据的抽取、融合与存储。
2.1 铁路调度应急预案知识图谱实体层的构建
实体指的是事物基础、本源的规范化概念,是实际存在的起作用的组织或机构、行为的发起者或执行者。实体是概念、属性、关系的集合,根据经验知识进行概念层次划分、要素属性识别、关联关系定义,完成实体层的构建。
2.1.1 主要实体概念
在铁路调度应急预案中,实体概念主要为应急处置任务的4个核心要素,包括应急事件、与应急处置相关的机构岗位职责、应急处置流程、应急处置评价。
(1)应急事件是因自然灾害、设备故障等因素对列车运行造成影响,需要调度人员采取故障处置、现场救援等措施实施干预的事件。
(2)机构岗位职责主要以调度所和应急指挥中心为核心,以二者的管辖机构、平行单位为辐射半径,会合与铁路应急处置相关的路外其他行业机构,机构内设置有应急处置的岗位职责。
(3)应急处置流程是指对于发生的应急事件,有关部门按其岗位职责需完成的指定任务。按照应急处置流程的不同阶段,将应急处置任务划分为事前、事发、事中、事后4个层次,可为每个阶段设定不同的目标和任务 [6],如表1所示。
表 1 应急处置流程概念实体的层次划分阶段 目标 任务 事前 预警、应急预备 风险监测、应急预警、应急准备 事发 快速启动应急、
应急通知启动应急响应、应急响应信息传递、
相关人员赶赴现场事中 高效处置 设备调配、车辆抢修、机车运行组织、
添乘重点列车、旅客疏散事后 快速恢复、
总结评价应急结束通知、应急总结分析、应急处置评价 (4)应急处置评价是对应急事件综合处理情况的各项评定,包括应急处置流程核心阶段的完成情况评价、相关部门履职情况评价等。
2.1.2 实体属性定义
每个实体具有多个基本属性,其每个基本属性可设置一到多个属性值。
(1)应急事件实体的属性包括事件类型、等级、发生时间、线路地点、发生原因、影响情况、应急措施等。
(2)机构岗位职责实体的属性包括部门名称、部门职责、岗位名称、岗位职责、人员信息等。
(3)应急处置流程实体的属性包括流程名称、流程内容、流程进度等。
(4)应急处置评价实体的属性包括评价项目、评价标准、评价结果、评价分析等。
2.1.3 实体关系定义
铁路调度应急预案中,除因果、跟随、并发、互斥、顺序等一般实体关系外,还包括表达隶属、协同、信息指令传达等领域业务逻辑的实体关系 [7],各类关系的含义,如表2所示。
表 2 铁路调度应急预案实体关系含义说明关系类型 含义 因果关系 某种情况的发生,必然会引发其他一种或多种事情 跟随关系 某一时段内,某一事件发生后,另一件事情跟着发生 并发关系 某一时段内,两个事件同时发生,或先后发生 互斥关系 两种类型的事件不可能同时发生 顺序关系 事件发生的先后顺序 隶属关系 概念层级关系,上下级隶属 协同关系 机构岗位之间的协同合作 信息指令传达关系 信息汇集或指令决策机构将信息、指令传达给接收单位 按照上述实体关系的定义,梳理出如图2所示的铁路调度应急预案知识图谱实体层结构。
2.2 铁路调度应急预案知识图谱数据层的构建
按照不同知识来源,将铁路调度应急预案涉及的多源异构信息资源进行数据抽取、数据融合与知识存储,构建铁路调度应急预案知识图谱数据层。
2.2.1 数据抽取
铁路调度应急预案涉及的数据来源较多,数据类型多样。除信息系统的结构化数据外,还有诸如从气象局网站获取的天气信息这类半结构化数据,以及处置现场图像、视频、事后总结分析等的非结构化数据。
(1)结构化数据一般存储于关系型数据库,因字段定义明确,一般通过设置字段映射规则,实现从数据库中自动抽取实体、属性及关系。
(2)半结构化数据本身存在一定结构但需要进一步提取整理,可利用包装器(Wrapper)进行抽取,由包装器从HTML网页中爬取数据,并重新组装为结构化数据。
(3)非结构化数据一般通过已知实体对非结构化内容进行标注,转化为有监督学习的问题[8-9]。图像、视频类非结构型数据可通过实体标注后进行分类抽取;文本型非结构化数据的抽取较为困难,以最小粒度的实体概念属性进行语义相似度校验,将关键信息抽取出来,例如应急规章制度文件中抽取具体场景的规章制度条款。
2.2.2 数据融合
对于非结构化文本数据,因中文描述的多样性,相同的内容可能存在多种表述,导致抽取的数据存在冗余。可通过计算语义相似度,对孤立的实体概念、属性和关系进行数据融合处理[10]。以地点和天气为例,非结构化文本数据融合结果前后对比,如表3所示。
表 3 非结构化文本数据融合示例数据融合前抽取的实体概念 数据融合后抽取的实体概念 北京南、北京南普速场、北京南普速到达场 北京南普速到达场 大雨、大到暴雨、强降雨、暴雨 大到暴雨 2.2.3 知识存储
将结构各异的多源数据转化为由开始节点、关系、结束节点3个元素组成的结构化数据,建立关系三元组<实体1,实体关系,实体2>。以跟随关系为例,应急处置流程总是跟随应急事件发生,对应的三元组关系可表示为<应急处置流程,跟随,应急事件>,以此建立实体关系集合。
对于属性和关系较为丰富的结构化数据,采用图数据库方式存储更有优势[11]。将关系三元组<实体1,实体关系,实体2>中的实体1和实体2存储为节点,属性关系、语义关系存储为边,将结构化知识三元组映射为图中的节点和边,以便于使用图查询语言和图挖掘算法实现基于知识图谱的具体应用[12-13]。
3 应用实例
以自然灾害启动应急预案为例,采用上述方法完成应急事件、机构岗位职责、处置流程、应急评价等应急预案核心实体概念及关联关系的形式化表达,将相对孤立、零散的多源数据转化为相互关联的知识结构体,构建铁路调度应急预案的知识图谱。
3.1 面向具体场景的应急预案实体结构图
鉴于铁路调度应急预案的核心要素与环节较多,内部关系复杂,采用实体结构图对铁路调度应急预案知识体系进行梳理。以自然灾害雾天行车场景为例,对处置过程中各部门岗位职责、关联信息以及外部资源等进行剖析,形成应急预案知识体系,如图3所示。
3.2 面向具体场景的铁路调度应急预案知识图谱构建
根据应急预案的相关概念实体结构图,对应急预案场景涉及的多源异构数据进行抽取、融合及存储,形成铁路调度应急预案知识图谱。以雾天行车场景为例,铁路调度应急预案知识图谱如图4所示。
3.3 应急预案知识图谱的应用场景模拟
针对雾天行车场景的应急预案知识图谱构建好之后,可以便利地综合展示预案相关信息,减少人工查找和汇集信息的工作量,应用如图5所示。
在大雾天气启动应急预案的应用场景中,通过将应急事件与对应场景处置的应急专家、相应故障的应急规章、历史案例及处置流程等多项信息建立起关联,实现了特定类型的应急预案的综合管理。在启动应急响应后,可以迅速参照响应规章制度进行工作部署,按照处置流程的提示逐步执行;处置过程中遇到难题时,能马上联系到具有相应应急救援场景处置经验的专家,召开分析会诊,快速查阅到可供参考历史案例等。
总之,知识图谱可以根据信息的内在关联性实现应急预案相关信息资源的整合和结构化展示,实现铁路调度应急预案的综合管理,使应急预案相关信息资源的使用更加便利化,更好地支持应急指挥快速决策,支持应急处置工作从容有序开展。
4 结束语
知识图谱概念和方法为领域知识的提取、融合和组织管理提供了有效的方法。依照知识图谱的构建方法,本文研究提出铁路调度应急预案的概念层次划分、要素属性识别、关联关系定义,将铁路调度应急预案相关信息资源组织成概念明确、结构清晰、联系紧密的知识体系;在此基础上,研究铁路调度应急预案的数据抽取、数据融合与知识存储方法,实现异构多源数据的规范、有序组织与存储,为应急预案相关信息资源的有效利用与综合展示提供良好条件。
铁路调度应急预案涉及的信息多种多样,目前还没有度量各类信息与应急预案关联的紧密程度,由此造成信息大量存储,不利于数据的高效利用。因此,今后需要对如何量化应急预案数据关联性开展深入研究,以提高铁路调度应急预案的综合管理、自主学习、关联性分析水平,为铁路应急调度指挥提供更加完备、有效的决策参考。
-
表 1 应急处置流程概念实体的层次划分
阶段 目标 任务 事前 预警、应急预备 风险监测、应急预警、应急准备 事发 快速启动应急、
应急通知启动应急响应、应急响应信息传递、
相关人员赶赴现场事中 高效处置 设备调配、车辆抢修、机车运行组织、
添乘重点列车、旅客疏散事后 快速恢复、
总结评价应急结束通知、应急总结分析、应急处置评价 表 2 铁路调度应急预案实体关系含义说明
关系类型 含义 因果关系 某种情况的发生,必然会引发其他一种或多种事情 跟随关系 某一时段内,某一事件发生后,另一件事情跟着发生 并发关系 某一时段内,两个事件同时发生,或先后发生 互斥关系 两种类型的事件不可能同时发生 顺序关系 事件发生的先后顺序 隶属关系 概念层级关系,上下级隶属 协同关系 机构岗位之间的协同合作 信息指令传达关系 信息汇集或指令决策机构将信息、指令传达给接收单位 表 3 非结构化文本数据融合示例
数据融合前抽取的实体概念 数据融合后抽取的实体概念 北京南、北京南普速场、北京南普速到达场 北京南普速到达场 大雨、大到暴雨、强降雨、暴雨 大到暴雨 -
[1] 王 普,李 平,阿茹娜,等. 融合本体和深度学习的高速铁路应急预案数字化方法 [J]. 铁道学报,2020,42(8):29-36. [2] 李 军. 应急预案信息化方法研究 [J]. 铁路计算机应用,2012,21(5):23-25. DOI: 10.3969/j.issn.1005-8451.2012.05.008 [3] 杜会芳, 王昊奋, 史英慧, 等. 知识图谱多跳问答推理研究进展、挑战与展望[J]. 大数据, 2021, 7(3), 60-79. [4] 陈华钧,张 文,黄志文,等. 大规模知识图谱预训练模型及电商应用 [J]. 大数据,2021,7(3):99-115. [5] 陈 强, 代仕娅. 基于金融知识图谱的会计欺诈风险识别方法研究[J]. 大数据, 2021, 7(3), 116-129. [6] 于 辉,江智慧. 突发事件下分阶段启动应急预案模型研究 [J]. 管理工程学报,2011,25(1):109-114. DOI: 10.3969/j.issn.1004-6062.2011.01.016 [7] 马雷雷,李宏伟,连世伟,等. 一种自然灾害事件领域本体建模方法 [J]. 地理与地理信息科学,2016,32(1):12-17. DOI: 10.3969/j.issn.1672-0504.2016.01.003 [8] 崔 斌,高 军,童咏昕,等. 新型数据管理系统研究进展与研究趋势 [J]. 软件学报,2019,30(1):164-180. [9] 李 洺,王 巍. 政府应急平台数据库的数据需求、实现路径与管理制度 [J]. 电子政务,2008(5):56-61. DOI: 10.3969/j.issn.1672-7223.2008.05.009 [10] 李泽荃. 基于知识图谱的灾害场景信息融合技术 [J]. 华北科技学院学报,2019,16(2):20-25. DOI: 10.3969/j.issn.1672-7169.2019.02.005 [11] 杜志强. 自然灾害应急知识图谱构建方法研究[J]. 武汉大学学报(信息科学版), 2020, 45(9): 1344-1355 [12] 刘 峤,李 杨,段 宏,等. 知识图谱构建技术综述 [J]. 计算机研究与发展,2016,53(3):582-600. DOI: 10.7544/issn1000-1239.2016.20148228 [13] 徐增林,盛泳潘,贺丽荣,等. 知识图谱技术综述 [J]. 电子科技大学学报,2016,45(4):589-606. DOI: 10.3969/j.issn.1001-0548.2016.04.012