Portable acquisition device and 3D spatial data management system for railway infrastructure
-
摘要: 针对铁路基础设施三维空间数据缺乏、采集困难、采集效率低、数据分散、难以集中管理维护等问题,研制了基于移动实景测量技术的便携式非接触采集装置,实现了铁路基础设施三维空间数据的采集;搭建了铁路基础设施三维空间数据管理系统,实现了对三维空间数据的集中、高效管理及存储。该系统采用线性参考系统构建技术,实现铁路基础设施三维空间数据与线性里程坐标的快速匹配。试验结果表明,所研制的采集装置和搭建的管理系统具有科学性、先进性和实用性,有效提高了铁路基础设施空间数据的采集效率和信息化管理水平。Abstract: Aiming at the problems of lack of three-dimensional spatial data of railway infrastructure, difficulty in collection, low collection efficiency, scattered data, and difficulty in centralized management and maintenance, this paper developed a portable non-contact acquisition device based on mobile real scene measurement technology to implement a three-dimensional spatial data acquisition of railway infrastructure, and built a three-dimensional spatial data management system for rail infrastructure to implement the centralized, efficient management and storage of three-dimensional spatial data. The system used the linear reference system construction technology to realize the rapid matching of three-dimensional spatial data of railway and linear mileage coordinates. The experimental results show that the acquisition device developed and the management system built are scientific, advanced and practical, and effectively improve the acquisition efficiency and information management level of three-dimensional spatial data of railway infrastructure.
-
近年来,城市轨道交通因其便捷舒适、绿色低碳等特点受到大众青睐,但大客流也造成了高峰时段站点拥挤、列车晚点等一系列问题[1]。客流的不断增加,使得短时客流预测成为运营部门保障行车安全、优化行车运营效率的关键,同时也为乘客出行规划提供参考依据[2-3]。短时客流预测指预测粒度小于15 min的客流预测,相比中长期预测具有更大的随机性和波动性,预测的准确性也直接关系到城市轨道交通组织运营的高效性和合理性。
针对城市轨道交通短时客流预测,众多学者研究采用非线性预测方法或组合优化模型的预测方法,证明了对短时客流进行预测的可行性[4-5]。但常用于客流预测问题的卷积神经网络或循环神经网络(RNN ,Recurrent Neural Network)模型受困于梯度消失或梯度爆炸,难以处理存在显著的季节特性、长时间跨度的数据,长短时记忆(LSTM,Long Short Term Memory )模型对这些问题进行了改进。王秋雯等人[6]将LSTM模型与自适应K-means算法结合,并证明了该方法在客流预测问题上的有效性;Liu等人[7]将历史数据分为最近、近期和长期分别输入LSTM模型中 ,提高了预测准确性。预测模型超参数的选择至关重要,影响着模型的好坏,一些研究人员引入优化算法进行优化。仇建华等人[8]使用遗传算法(GA,Genetic Algorithm)优化相关向量机的核函数和核参数;惠阳等人[9]使用粒子群算法优化BP(Back Propagation)神经网络。
本文引入能有效处理复杂非线性问题、优化初始值和阈值的GA,对堆叠式LSTM(SLSTM,Stacked LSTM)模型的神经网络结构进行优化,构建了GA-SLSTM预测模型。采用该预测模型对车站进出站客流进行预测,以杭州市地铁历史运营数据为例展开试验。对比GA-RNN模型和单层未优化LSTM模型对普通站点和换乘站的客流预测结果,证明了本文方法能够提高短时客流的预测精度。
1 GA-SLSTM地铁客流预测模型
1.1 SLSTM模型概述
LSTM模型在1997年由Hochichreiter和Schmidhuber提出[10],保持了RNN模型的链状结构,改进了RNN模型不能处理长期依赖的情况,并在一定程度上解决了梯度消失的问题,适用于学习具有长期趋势性和周期性的客流序列。LSTM模型单元内部结构增加了遗忘门
$ {f_t} $ 、输入门$ {i_t} $ 和输出门$ {o_t} $ 3个门限控制,通过Sigmoid函数和点乘操作,限制序列信息的流入,并将上一时刻状态输入下一时刻进行计算,其数学表达式为$$ {f_t} = \sigma ({{\boldsymbol{W_f}}} \cdot [{h_{t - 1}},{x_t}] + {b_f}) $$ (1) $$ {\widetilde C_t} = \tanh ({{\boldsymbol{W_C}}} \cdot [{h_{t - 1}},{x_t}] + {b_C}) $$ (2) $$ {i_t} = \sigma ({{\boldsymbol{W_i}}} \cdot [{h_{t - 1}},{x_t}] + {b_{\boldsymbol{i}}}) $$ (3) $$ {C_t} = {f_t}\cdot{C_{t - 1}} + i\cdot {\widetilde C_t} $$ (4) $$ {o_t} = \sigma ({W_o}[{h_{t - 1}},{x_t}] + {b_o}) $$ (5) $$ {h_t} = {o_t}\cdot\tanh ({C_t}) $$ (6) 其中,
$ {x_t} $ 为t时刻输入数据;$ \sigma $ 为Sigmoid函数;$\{ {{\boldsymbol{W_i}}},{{\boldsymbol{W_f}}},{{\boldsymbol{W_o}}},{{\boldsymbol{W_C}}}\}$ 分别为输入门、遗忘门、输出门和细胞状态的参数矩阵;$\{ {b_i},{b_f},{b_o},b_C^{}\}$ 为输入门、遗忘门、输出门和细胞状态的偏移量;$ {\widetilde C_t} $ 为候选细胞状态,$ {C_t} $ 为细胞状态;$ {h_t} $ 为隐藏状态。SLSTM模型中有多个隐藏LSTM层,每层包含多个LSTM单元,可对长期状态进行处理。Graves等人[11]证明了LSTM层级的堆叠比增加内部LSTM单元具有更好的预测性能,可通过加深网络层级解决更加复杂的问题。SLSTM结构层级间的状态转移如图1所示,上层的LSTM结构输出一个隐藏状态序列,输入到下一层结构中,其中,
$ C_t^l $ 和$ h_t^l $ 分别是第l层t时刻的细胞状态和隐藏状态。1.2 GA-SLSTM模型
GA是生物遗传和进化的优化算法,具有较强的全局搜索能力,本文采用GA对SLSTM模型进行优化。主要优化的参数有:SLSTM层数、SLSTM隐藏层每层单元数量、全连接层层数、全连接层每层神经元个数。针对具有非线性和随机性的城市轨道交通短时客流预测问题,建立了GA-SLSTM 预测模型,如图2所示。
其中,
$ x_s^{(t)} $ 和$ y_s^{(t)} $ 分别表示s站t时刻的输入和输出数据,输入前k个时间段的历史数据,得到后z个时间段的预测值。设置SLSTM和全连接层数分别在1~4之间,基本可满足本文实验数据集的需求。初始每层神经元个数为在[32, 256]范围内产生的随机数,进而生成初始种群。根据每个种群的染色体搭建对应神经网络模型,神经网络层级结构从上至下为输入层、SLSTM层、全连接层和输出层。全连接层包括全连接Dense层、防止过拟合的Dropout弃权参数层和用于隐藏层批标准化的Batch Nomalization层。本文采用评价指标均等系数EC作为种群适应度AEC$$ A_{{\rm{EC}}} = 1 - \dfrac{{\sqrt {\displaystyle\sum\nolimits_{i = 1}^n {{{(\widehat {{y_i}} - {y_i})}^2}} } }}{{\sqrt {\displaystyle\sum\nolimits_{i = 1}^n {y_i^2} } + \sqrt {\displaystyle\sum\nolimits_{i = 1}^n {\widehat {{y_i}}} } }} $$ (7) 其中,
$ {y_i} $ 为真实值;$ \widehat {{y_i}} $ 为预测值。均等系数$A_{{\rm{EC}}} \in [0,1]$ ,其值越接近1表示预测值越接近真实值,则该个体被选择的概率也越大,下一代种群根据适应度选择个体,并进行交叉、变异操作。本文设置最大种群迭代为20代,重复选择、交叉和变异生成随机种群,并搭建相应模型直至最大种群迭代,输出预测结果AEC值最大的最优个体和相应预测模型。2 客流变化特征分析
由于乘客日常出行具有规律性,站点进出站客流表现出明显的周期性,同时,由于天气、突发活动等随机因素的影响,使其具有波动性。本文以杭州市1号线普通站点西兴站和换乘站火车东站为例分析客流变化特征。
2.1 一个星期内客流特征
2019年1月5—25日西兴站3个星期内的客流进站情况如图3所示。从图3中可知,单日内客流随机波动大,1个星期内客流曲线存在相似性,工作日和休息日客流特性呈现出明显差异,工作日表现出双峰型客流特征,休息日表现出明显的无峰型客流特征;星期与星期之间客流变化趋势相似,具有明显的周期性。
采用层次聚类算法将1个星期7天客流量作为聚类特征,簇间样本点间距离采用欧式距离计算,生成层次聚类树形图如图4所示,虚线为类别分割线。从图4中可看出,虚线将西兴站1个星期进站客流划分为星期一~星期五和休息日两类,工作日和休息日客流特征分化明显,可将1个星期内的进站客流量分为工作日和休息日2类。而属于换乘站的火车东站工作日与休息日之间客流分布没有明显相似性,每一天客流趋势都被单独划分,与其余几天欧式距离较大。西兴站2个星期之间每日客流的Spearman相关系数如表1所示。从表1中可知,工作日与上个星期工作日间相关系数大,相关系数最大值在上个星期相邻几日间略有浮动,和上个星期工作日的相关系数较小;休息日和上个星期工作日相关性小,星期六和星期日分别与上个星期六和上个星期日相关系数最大,周期性明显。
表 1 西兴站2个星期之间客流Spearman相关系数星期一 星期二 星期三 星期四 星期五 星期六 星期日 上个星期一 0.976 0.968 0.975 0.971 0.955 0.778 0.623 上个星期二 0.979 0.972 0.976 0.975 0.952 0.759 0.596 上个星期三 0.970 0.972 0.973 0.965 0.955 0.784 0.631 上个星期四 0.961 0.974 0.970 0.963 0.957 0.776 0.628 上个星期五 0.955 0.956 0.952 0.951 0.972 0.806 0.658 上个星期六 0.768 0.776 0.775 0.778 0.789 0.935 0.890 上个星期日 0.600 0.617 0.611 0.604 0.645 0.899 0.965 2.2 日客流特征
车站1日内进出站客流体现出固定的客流趋势,分为单峰型、双峰型、全峰型和无峰型,早晚高峰不同时间段和平峰不同时间段间客流存在相似性。图5是星期一不同时间段进站客流层次聚类的散点图,选用刷卡闸机数/min、客流量/min、当前时间段客流量、前后时间段客流量等23维聚类特征映射到多维空间进行聚类。西兴站远离市中心,全天客流量较小,高峰时进站客流量在60 人/min左右,平峰时在5 人/min左右。火车东站属于全峰型客流特征,高峰客流达到150 人/min。虽然不同站点日内客流分布不同,但图5中高峰段和平峰段等不同时间段分类明显。
3 地铁客流预测实例与结果分析
3.1 数据预处理
本文采用2019年1月5—25日杭州市地铁AFC系统的历史刷卡记录作为实验数据,共81个站点,每天约200万条刷卡记录。每条刷卡记录的数据包含刷卡时间、用户ID、站台编号闸机设备编号、进出站状态、线路号和支付类型。检查重复值和空值后,整理成10 min为粒度的进出站客流数据样本,整理后共291600个数据样本。将2019年1月5—21日的数据作为训练集,2019年1月22—24日的数据为验证集,对2019年1月25日站点进出站客流进行10 min粒度预测。
3.2 特征提取
提取乘客进出站时间、星期、每10 min间隔的进出站刷卡闸机的数量和天气等14维基本特征,其中,天气特征包括空气质量、风向、风速、气温和状态(晴、阴、雨)。将1日内每10 min和1个星期内每天客流量聚类结果进行定量转换,提取每类的类别标签、平均值和方差作为1日内和1个星期内时间特征。2个星期之间的时间特征直接提取上个星期Spearman相关系数最大的一天的客流数据。
3.3 实验及结果分析
图6是对西兴站的预测模型进行GA优化的前11代种群的适应度曲线。可以看出,第4代之后适应度值趋于平稳,第11代种群的适应度基本高于0.9,逐渐收敛于全局最优解。因此,设置最大种群迭代为20代,每代有10个个体。
为更加直观地衡量预测效果,引入平均绝对误差(MAE ,Mean Absolute Error)、均方根误差(RMSE ,Root Mean Square Error)和决定系数(R2)对预测结果进行评价,计算公式为
$$ E_{\rm{MAE}} = \frac{1}{n}\sum\nolimits_{i = 1}^n {|{y_i} - \widehat {{y_i}}|} $$ (8) $$ E_{\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\nolimits_{i = 1}^n {{{({y_i} - \widehat {{y_i}})}^2}} } $$ (9) $$ E_{\rm{R2}} = 1 - \frac{{\displaystyle\sum\nolimits_{i = 1}^n {{{({y_i} - \widehat {{y_i}})}^2}} }}{{\displaystyle\sum\nolimits_{i = 1}^n {{{({y_i} - \overline y )}^2}} }} $$ (10) EMAE表示平均预测差值程度,ERMSE表示单位时间间隔平均预测误差的人数,因此E MAE
、E RMSE 越小,预测精确度越高。ER2代表模型对数据的拟合程度,数值越大,预测值越接近真实值。 LSTM模型是RNN模型的继承和发展,因此选取GA-RNN模型和单层未优化LSTM模型与本文提出的GA-SLSTM预测模型进行对比,每种模型训练3次取预测结果评价指标的平均值。单层LSTM模型的神经元个数在[32, 256]范围内、间隔32的数组中依次选取,以EMAE最小值的预测值作为预测结果。
3.3.1 普通站点预测结果
不同模型对西兴站的预测值与真实值曲线如图7所示,预测评价指标如表2所示。可见,本文提出的方法各项指标均优于其他方法,预测值更接近真实值,ER2可达0.95。
表 2 西兴站不同模型预测指标对比
指标GA-SLSTM GA-RNN LSTM MAE 1 平均值 22.42 22.90 38.08 36.84 25.70 23.46 2 21.19 40.83 23.99 3 25.08 31.60 20.70 RMSE 1 平均值 33.13 34.92 57.64 52.54 35.97 35.74 2 33.56 52.37 36.48 3 38.08 47.60 34.77 R2 1 平均值 0.95 0.95 0.86 0.88 0.94 0.94 2 0.95 0.88 0.94 3 0.94 0.90 0.95 3.3.2 换乘站点预测结果
不同模型对换乘站火车东站的预测值及真实值曲线如图8所示,预测评价指标如表3所示。由于换乘站客流随机波动大,周期特征不明显,预测准确度低于普通站点。不同模型的预测值基本符合真实值,本文提出的方法各项指标均优于其他方法。
表 3 火车东站不同模型预测指标对比
指标GA-SLSTM GA-RNN LSTM MAE 1 平均值 113.83 115.34 111.61 116.31 140.76 135.09 2 112.63 119.49 132.72 3 119.56 117.84 131.80 RMSE 1 平均值 157.16 161.03 163.32 162.25 185.80 178.70 2 159.12 155.55 175.27 3 166.82 167.89 175.04 R2 1 平均值 0.90 0.90 0.89 0.90 0.87 0.88 2 0.90 0.91 0.88 3 0.89 0.89 0.88 4 结束语
实验结果表明,本文提出GA-SLSTM模型能够提高城市轨道交通短时客流预测准确性。引入GA优化神经网络结构,相比手动调参等方式,使得模型更有说服性。优化后的SLSTM预测模型能够学习长序列信息,精确预测客流变化,无论是在普通站点还是在换乘站点,其预测效果都明显优于其他模型。此外,为更好地提高短时客流预测准确性,下一步需对换乘站的大客流数据进行趋势、周期和噪声分解分析及研究,进一步提高换乘站预测准确性。
-
表 1 “天地图”数据服务内容
数据类型 具体内容 矢量瓦片地图 水体、地貌、土质、植被等自然地理要素,以及居民地、
交通网、行政区域界线等社会经济因素影像瓦片地图 地面分辨率达到2.5 m 地形瓦片地图 用等高线表示地面起伏的地图 中文注记 省、市、县(区)、乡等区域名称 地名、地址、兴趣点 民用机场、高等院校、客运火车站、5A级景区①、公园、
医院、政府机构、事业单位、餐饮、宾馆、地名、地址、
地铁站、公共设施等注:①5A级景区:国家AAAAA级旅游景区。 表 2 采集装置技术指标的测试结果
技术指标 测试结果 点云精度 平面坐标精度高于15 cm,高程坐标精度高于10 cm 量测精度 满足地图比例为1∶2 000的测量精度 定位精度 平面坐标精度高于20 cm;姿态精度(横滚/俯仰) 0.02° 照片分辨率/像素 4 096×2 160 视频分辨率/像素 1 920×1 080 实景测量视场角 水平视场角与垂直视场角均为70° -
[1] 胡伟强. 基于GIS技术的运营铁路快速测量数据管理技术 [J]. 铁道建筑,2020,60(5):150-152. DOI: 10.3969/j.issn.1003-1995.2020.05.35 [2] ARASTOUNIA M, VILARIÑO L D, AZENHA M. An enhanced algorithm for concurrent recognition of rail tracks and power cables from terrestrial and airborne LiDAR point clouds [J]. Infrastructures, 2017, 2(2): 8. DOI: 10.3390/infrastructures2020008
[3] 任 洁. GPS-RTK技术在既有铁路高程勘测中的应用方法研究[D]. 兰州: 兰州交通大学, 2020. [4] 陈 隆. 铁路地理数据采集与管理系统建设应用探讨 [J]. 勘察科学技术,2020(4):45-49. DOI: 10.3969/j.issn.1001-3946.2020.04.010 [5] 张景怡,徐广锋,陈南翔,等. 实景三维移动测量系统在公路养护管理中的应用 [J]. 北方交通,2020(1):34-37,42. [6] 晋 杰, 蒋丽丽, 王英杰, 等. 基于GIS的数字环铁平台研究[C]//第十三届中国智能交通年会优秀论文集. 北京: 电子工业出版社, 2018: 5. [7] 王开锋,蒋 韵,王祖元,等. 压缩算法在GSM-R分组域数据传输中的应用研究 [J]. 铁路计算机应用,2015,24(10):51-52,58. DOI: 10.3969/j.issn.1005-8451.2015.10.013 [8] 李聪旭, 胡伟强, 封博卿. 运营铁路工务线路空间信息采集与管理技术研究[C]//第十三届中国智能交通年会优秀论文集. 北京: 电子工业出版社, 2018: 7. -
期刊类型引用(3)
1. 张思楠,李树彬,曹永军. 基于LSTM-Transformer的城市轨道交通短时客流预测. 物流科技. 2024(14): 103-106+114 . 百度学术
2. 张瑞,席一丹,白惠君,周晓渊,韩峰宇. 基于WT-SLSTM模型的交通流预测研究. 山西交通科技. 2023(04): 129-133 . 百度学术
3. 周明杉,卫铮铮,李聚宝. 基于突发公共卫生事件影响下的铁路客流量恢复率预测研究. 铁道运输与经济. 2023(12): 57-64 . 百度学术
其他类型引用(4)