• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

城市轨道线网运营调度大数据服务平台及其应用

李文俊

李文俊. 城市轨道线网运营调度大数据服务平台及其应用[J]. 铁路计算机应用, 2023, 32(5): 74-79. DOI: 10.3969/j.issn.1005-8451.2023.05.15
引用本文: 李文俊. 城市轨道线网运营调度大数据服务平台及其应用[J]. 铁路计算机应用, 2023, 32(5): 74-79. DOI: 10.3969/j.issn.1005-8451.2023.05.15
LI Wenjun. Big data service platform for urban rail network operation and dispatching and its application[J]. Railway Computer Application, 2023, 32(5): 74-79. DOI: 10.3969/j.issn.1005-8451.2023.05.15
Citation: LI Wenjun. Big data service platform for urban rail network operation and dispatching and its application[J]. Railway Computer Application, 2023, 32(5): 74-79. DOI: 10.3969/j.issn.1005-8451.2023.05.15

城市轨道线网运营调度大数据服务平台及其应用

基金项目: 北京市自然科学基金项目(L221010)
详细信息
    作者简介:

    李文俊,工程师

  • 中图分类号: U231 : TP39

Big data service platform for urban rail network operation and dispatching and its application

  • 摘要: 分析城市轨道交通网络化运营调度指挥业务的数据内容与特点,提出基于云平台的城市轨道线网运营调度大数据服务平台架构方案,创建以运营、调度、评估、安全为主题要素的数据资源目录,实现专业数据主题式访问服务。介绍客流指标统计分析、客流监视预警等典型应用场景,为运营管理和科学制定调度策略提供决策支持。
    Abstract: This paper analyzed the data content and characteristics of urban rail transit network operation and scheduling command business, proposed a cloud platform based big data service platform architecture for urban rail transit network operation and dispatching, created a data resource catalog with operation, dispaching, evaluation, and security as the main elements, and implemented professional data thematic access services, introduced typical application scenarios such as statistical analysis of passenger flow indicators and passenger flow monitoring and warning to provide decision-making support for operation management and scientific formulation of dispatching strategies.
  • 随着大数据技术的广泛应用,城市轨道交通企业数据中心陆续汇聚的各种多源异构数据为开展深度数据挖掘、实现数据全面共享创造了条件[1]。由于各企业采集的数据来自不同类型的源系统,数据积累程度不一、完整性欠缺、标准化程度不高,不易被进一步利用和发挥潜在效益,难以与业务深度融合,无法为生产运营提供便捷服务[2-3],成为挖掘数据价值的瓶颈。近年来,国内陆续开展了城市轨道交通各类专业的大数据应用和数据挖潜的研究[4-5]。本文立足运营调度管理,针对网络化运营过程中对大数据应用的需求,提出城市轨道线网运营调度大数据服务平台的架构,围绕主要业务应用场景下多专业、多层级的数据内容和数据服务的特点,创建数据资源目录,实现专业数据主题式访问服务。

    城市轨道交通运营调度业务的开展需要大量的数据,覆盖行车、安全、客流、设备、运营组织、客运组织等多个方面[6-9],数据源庞大、数量多且封闭,数据结构和类型多样,专业性要求高,融合难度大。从业务视角,数据内容包括以下几类。

    轨道基础设施数据,运营相关的车站、区间、房屋及其他(构)筑物、轨道、设备、专用工器具、备品备件,以及内部“人、财、物”相关的数据。

    (1)生产运营数据,如行车信号、供电、机电环境监控、售/检票设备等数据;运输组织数据,如运输计划、日(班)计划、调度计划等数据;

    (2)客运数据,如客运站作业、客运生产、客运业务联动等数据;

    (3)运力资源数据,如固定设备、移动设备、资源运用、资源检修、施工调度等数据,安全检测、安全监督、风险隐患、事故处置、应急救援、应急物资等数据。

    用户、统一认证、办公系统、归档文件、审批流转、资产等数据。

    描述城市轨道交通系统内运行状态的数据,如列车运行状态、设备监控、客流、故障报警等数据。

    根据运营调度管理的日常生产和业务,概括数据应用和数据服务的特点如下。

    为了使各类系统产生的数据高度共享和可辨识、再利用,需要统一基础数据的数据结构和格式,制定统一编码,以便建立业务关联。

    具有专业特性的数据,在数据结构中应设置能够建立业务流程逻辑的通用数据标识,便于在业务的数据流中检索到。

    统一规约同类业务的计算指标、计算方法、计算维度、查询条件,实现跨系统数据融合时的结果一致。

    随着线网规模日益复杂,运营场景/地不断丰富,运营规律和特点具有不可预测性,数据应用需求将爆发式增长,数据服务平台的框架应可扩展。

    结合运营调度管理内部和外部的数据资源需求,以应用场景为导向,设定数据采集、数据应用、数据深度服务为主要构建方向[10]。运营调度大数据服务平台的数据管理范围覆盖基础数据、业务数据、管理数据、指标数据,以及在轨道交通系统运行中产生的动态数据;同时,力求数据满足规范化、标准化、唯一性要求,保障在多种专业、不同维度的统计视角下计算结果的一致性。

    运营调度大数据服务平台构建在混合云上,采用分布式集群技术架构和Hadoop技术,通过数据仓库工具Hive、服务接口封装的方式对外提供数据,通过流式计算、微服务方式将数据处理和数据应用模块与外部业务系统对接。该平台由数据源层、数据服务容器和智慧应用层构成,架构如图1所示。

    图  1  运营调度大数据服务平台架构

    主要提供从各类系统获取的基础设施、生产调度、业务应用、管理及外部系统的数据。

    数据服务容器是大数据服务平台的核心功能中枢。

    基于容器云资源调度,形成包括网络资源、存储资源、操作系统、容器服务、数据集成的基础构成。对外提供数据调取、数据服务、决策服务。

    将所有获取到的数据和经二次加工处理后的数据进行统一转换、标准化后,按照系统业务数据结构体系保存,提供数据检索、共享开发、报表分析等服务,供应用层接口调用。

    包括数据资源目录、指标可视化、主题库、知识库等服务。

    提供分析挖掘、算法、算力引擎,包括计算引擎、知识图谱、模型共享等决策服务,构建综合监视、调度指挥、评估分析等模型主题域。

    对接口、数据编码、数据质量等进行统一管理,对数据进行容灾日志备份,确保数据安全。

    通过接口调取各类数据资源及决策服务,实现数据状态监测、统计分析、运营评估、预警/报警等智慧化应用,为多业务协同联动提供数据支撑。

    为了有效管理运营调度大数据服务平台的数据服务,对组织机构、基础设施、设备物资、移动资源等基础库、调度部门共享库和应用主题库的数据进行梳理,创建以运营、调度、评估、安全为主题要素的数据资源目录,实现编目自动化、查询数据化;同时,定义元数据及制定编目规则,实现专业数据主题式访问服务。

    数据资源目录作为运营调度大数据服务平台的独立模块,采用分层设计。其架构如图2所示。

    图  2  数据资源目录架构

    存放可以公开或可在业务部门间共享的数据资源。包括资产、人力、物资等基础库,以及行车信号、客流、车辆、供电、机电设备、客运组织、安全管控、应急处置等业务主题库。

    依托元数据体系,构建部门、基础、数据开放类别、应用、服务、业务等目录[11]

    提供各类应用服务接口,供应用的调用,以及资源目录与交换数据源间的数据交换和访问。

    通过数据资源门户使用目录服务,使用各类工具查询目录。

    以专业分类的方式将数据资源核心元数据编制成调度专业类数据资源目录,作为对外发布的数据资源共享清单。

    数据资源核心元数据包括数据资源的分类、名称、代码、提供方、提供方代码、摘要、格式、数据项、共享属性、开放属性、发布日期、关联分类及类目名称。根据调度业务,形成初步数据资源清单,包括运营监控、行车计划、调度管理、运营评估、安全保障和客运组织等6类主题。

    对数据资源进行分类与编目。

    (1)按部门分类编目(管理、专业、职能等部门),形成部门目录;

    (2)按基础数据库分类编目(组织机构、物资、基础设施、移动装备、日志等),形成基础库目录;

    (3)按数据开放类别分类编目(开放、公开、部门共享、不公开的数据),形成共享开放目录;

    (4)按应用分类编目,形成应用目录。其直接业务包括运行监控、列车运行计划、开行方案、车辆资源、客运方案、乘务计划、调度指令、运营指标、应急响应等,间接业务包括站务、票务、维修、施工调度等;

    (5)按数据格式分类编目(结构化、非结构化(视频、图像)、半结构化),形成结构目录;按服务主体分类编目(政府、企业、部门、乘客等),形成服务目录。

    以数据资产名称的汉语拼音全拼为码头,用注册日期为时间码,以数据类型编码为第3段识别码,最后结合数据的级别码,组合成可读性较强、复杂度不高的编目格式。由于视频、图像类非结构化数据的种类及属性多样,不能自动识别,须对非结构化数据属性进行标识,增加“机读”能力。将属性标识内容与注册数据进行关联,绑定唯一的编目编码,由标识表的字段代替非结构化数据,实现对非结构化数据的辨识。

    定义“车站、线路、线网”3级资源目录作为数据共享目录,通过车站与线路2级目录级联,可订阅获取生产运营一线的共享资源数据,线路与线网2级互联,可获取不同线路运营部门、线网管理部门、决策管理层的共享资源数据,进一步为业务、组织管理部门的纵向资源数据互通共享提供支撑。

    建立数据采集共享协议,约定数据采集的原则、内容及方式。

    根据数据应用的范围、安全保密要求等,将运营调度大数据服务平台管理的数据资源划分为4个级别,对数据进行分级管理。

    (1) 局部共享数据。企业内部以安全网域为单位划分的系统,围绕运营调度相关的生产、管理、维修保养业务,以最小交叉为条件的局部共享数据。

    (2) 内部完全共享的数据。部门之间达成一致共识后可在部门间互享数据,基于共享数据开发的数据服务应用,在相关部门内部使用。

    (3) 公开数据。有权限的互联网公开数据,如客流拥堵、突发事件数据等,数据脱敏后,通过官方网站或对外媒体向大众公开,供社会查询、监督。

    (4) 开放数据。通过数据开放模块,供上级政府部门、其他交通方式、外部社会单位获取和集成应用的数据。

    通过从各类系统采集数据,在运营调度大数据服务平台进行数据初始化。初级应用主要是面向生产业务和调度管理部门,为其提供标准化基础类数据,包括运营相关的基础数据,如正点率、最小行车间隔、日均客运量、车辆可用率等,以便围绕各条线路、线网的运行情况,进行统计分析、特征分析、交叉关联分析等。

    通过实时接入可互操作、泛在互联的物联网和自组织网络,实现城市轨道交通多制式、多专业、多设备的线网运营业务数据的获取、传输和识别。

    由于各类系统制式不一,接口标准各异,例如通信系统采用嵌入式接口,供电设备状态采集基于104协议,信号系统接口采用报文,机电设备状态采集采用Modbus协议等,因此,运营调度大数据服务平台的数据采集端接入这些系统时,采用Kafka进行数据处理,并同步进行数据模板化和格式化处理,统一接口规范,约定接口方式、接口功能、接口界面、数据内容、数据采集频率等。

    接口计算服务系统是为了使多源、异构数据融合,联接数据源和数据使用方,实现数据应用能力的扩展,提供“一站式”数据接口访问与共享服务。包括:接口生成、接口管理、接口代理和接口监控。数据接口处理原理,如图3所示。

    图  3  数据接口处理原理

    结合数据内容和特点,进行数据治理,提高数据质量。

    (1)结合运营调度的日常运营组织和非常态管理的应用场景,将数据质量的指标划分为类别指标,定义基本分类,归并各类别下同性质的数据;

    (2)对各类系统或人工录入的数据设定数据主题集,如列车运行图主题,进行数据对象的规范化,抽取编制行车计划的线路、车辆、客流、开行方案等数据,计算数据对象的质量指标;

    (3)灰色关联度分析法是根据因素之间发展趋势的相似或相异程度(灰色关联度),作为衡量因素间关联程度的一种方法。在本文中,应用灰色关联度分析法,根据计算得到的数据对象集的关联系数,按照业务主题的关联程度序列化,定量地描述数据标准和表达语义的关联性,剥离与规范数据标准距离较远的数据,定义序列权重系数,形成指标值,经过指标比选,逐步将不同数据源获得的同类数据,在统一的比选框架下,精选出质量较高的数据,作为运营调度大数据服务平台的标准化数据。

    为常用的典型场景定义主题,包括政策实施影响指标评估、大型活动保驾护航评估、突发事件影响评估、限流及车站关闭影响评估、重点日期客流组织评估等,以及业务主题组合分析。根据主题定义常用数据集,包含基础数据、指标数据、参数集、计算维度和预选条件,根据预设计算条件调取对应的数据集,生成数据查询结果,从而实现快速调阅数据结果服务。

    在轨道交通大数据服务平台中,根据数据提供类型、价值和服务方式不同,将其划分为直接式数据和间接式数据。直接式数据主要是数据采集、治理环节产生的数据,如指令数据、监测数据等,用于运营管理人员掌握线路的列车、客流、设备等运行情况;间接式数据主要指对原始数据进行抽取、运算、分析、钻取、挖掘等二次操作后的数据,用于业务决策支持和交易服务。

    以客流为主题的数据主要用于预测常态、非常态的客流量,作为编制开行方案、列车运行计划及调整、线网运营影响分析的基础数据,对业务的覆盖度最高。

    基于自动售检票(AFC,Auto Fare Collection)系统的基础数据,在时间窗约束下,抽取基于时间、空间如网络、线路、断面、车站等多个维度的客流数据,统计含断面客流、换乘客流、线路客运量及周转量、网络客运量及周转量、平均运距、线路和网络的客流不均衡系数等指标,实时进行客流预测与预警,推演实时客流分布状态。

    支撑线网客流对比和趋势分析,如图4所示。基于客流分布计算结果数据,提供同比与环比及客流特征数据服务。通过对历史客流数据的分析与挖掘,描述线网的客流特征变化,为长、中、短期客流预测模型的构建提供数据支持。

    图  4  轨道交通运营大数据服务平台的主题统计截图

    通过车站进/出站客流数据分析结果,确定趋势曲线、报警阀值;调取线路区间断面运量数据,与运力数据对比,区分准实时、历史数据,超过设定阈值时自动报警;通过读取、分析视频等非结构化数据,进行监视检测计数、重点位置的客流数据研究判断,当某位置的监视计数上升到设定阈值时,自动触发报警;可计算出本站进站、停站、出站列车的乘客拥挤度数据,基于实时客流监测及短时客流演化,结合线网列车运行实时监视及态势推演数据,在突发运营事件时,可产生运营组织调整策略分析比选结果,进行异常情况下线路客流分布及演变预测,推演事件影响范围,并计算出大客流车站、能力瓶颈的线路及区间关注点。

    本文构建了城市轨道线网运营调度大数据服务平台,为运管管理和科学地制定调度策略提供决策支持;为了提高数据应用的便捷性和数据服务价值,创建了数据资源目录体系,实现了快速数据服务调阅,使精准服务和按需获取成为提高数据应用价值的重要特征。该平台在网络化运营调度指挥中心客流指标统计分析、客流监察预警等服务的试运用中,表现出了良好的性能,发挥了数据价值。未来,将对列车、设备状态等多元异构数据进行处理和分析,进一步挖掘该平台的功效。

  • 图  1   运营调度大数据服务平台架构

    图  2   数据资源目录架构

    图  3   数据接口处理原理

    图  4   轨道交通运营大数据服务平台的主题统计截图

  • [1] 顾伟华,黄天印,郭 鹏,等. 城市轨道交通大数据体系建设的思考 [J]. 城市轨道交通研究,2018,21(9):1-4.
    [2] 杨 燕,朱 焱,戴 齐,等. 智慧轨道交通——实现更深入的智能化 [J]. 计算机应用,2012,32(5):1205-1207,1216.
    [3] 国艳群,韩 敏,孙林夫. 基于开放架构的SaaS服务平台数据管理技术研究 [J]. 电子科技大学学报,2015,44(2):295-298,305.
    [4] 何世伟,宋 瑞,李玉斌. 铁路运输态势推演系统架构及关键技术研究 [J]. 北京交通大学学报,2021,45(4):28-36.
    [5] 唐 超,侯海倩,马全明,等. 轨道交通岩土工程勘察数据采集服务系统设计与实现 [J]. 都市快轨交通,2021,34(3):113-118.
    [6] 荀 径,赵 娇,孙玉霖,等. 基于数据挖掘的城轨系统电能消耗模式分析 [J]. 北京交通大学学报,2020,44(5):8-16.
    [7] 王 磊,陈 青,高洪雨,等. 基于大数据挖掘技术的智能变电站故障追踪架构 [J]. 电力系统自动化,2018,42(3):84-91.
    [8] 佘振国,宁 静,周 豆,等. 铁路运输安全监督管理大数据应用研究 [J]. 铁路计算机应用,2021,30(3):19-22.
    [9] 姚向明,赵 鹏,韩宝明,等. 基于售检票数据挖掘的轨道交通乘客居住区辨识 [J]. 交通运输系统工程与信息,2016,16(5):233-240.
    [10] 雷 军,叶航军,武泽胜,等. 基于开源生态系统的大数据平台研究 [J]. 计算机研究与发展,2017,54(1):80-93.
    [11] 邓仲华,刘伟伟,陆颖隽. 基于云计算的大数据挖掘内涵及解决方案研究 [J]. 情报理论与实践,2015,38(7):103-108.
  • 期刊类型引用(1)

    1. 李静瑜,丁菊霞. 轨道交通智能化发展现状及关键系统分析. 计算机应用. 2024(S2): 316-322 . 百度学术

    其他类型引用(0)

图(4)
计量
  • 文章访问数:  102
  • HTML全文浏览量:  15
  • PDF下载量:  28
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-10-14
  • 网络出版日期:  2023-05-28
  • 刊出日期:  2023-05-24

目录

/

返回文章
返回