• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

基于GA-SLSTM模型的城市轨道交通短时客流预测

滕腾, 刘正琦, 王小敏

滕腾, 刘正琦, 王小敏. 基于GA-SLSTM模型的城市轨道交通短时客流预测[J]. 铁路计算机应用, 2022, 31(8): 7-12. DOI: 10.3969/j.issn.1005-8451.2022.08.02
引用本文: 滕腾, 刘正琦, 王小敏. 基于GA-SLSTM模型的城市轨道交通短时客流预测[J]. 铁路计算机应用, 2022, 31(8): 7-12. DOI: 10.3969/j.issn.1005-8451.2022.08.02
TENG Teng, LIU Zhengqi, WANG Xiaomin. Short-term passenger flow prediction of urban rail transit based on optimized GA-SLSTM[J]. Railway Computer Application, 2022, 31(8): 7-12. DOI: 10.3969/j.issn.1005-8451.2022.08.02
Citation: TENG Teng, LIU Zhengqi, WANG Xiaomin. Short-term passenger flow prediction of urban rail transit based on optimized GA-SLSTM[J]. Railway Computer Application, 2022, 31(8): 7-12. DOI: 10.3969/j.issn.1005-8451.2022.08.02

基于GA-SLSTM模型的城市轨道交通短时客流预测

基金项目: 四川省科技计划项目(2020YFG0353)
详细信息
    作者简介:

    滕 腾,在读硕士研究生

    刘正琦,在读硕士研究生

  • 中图分类号: U231.92 : TP39

Short-term passenger flow prediction of urban rail transit based on optimized GA-SLSTM

  • 摘要: 城市轨道交通短时客流预测可为相关运营部门实时调整行车调度、提高运营效率提供重要的决策依据,为乘客提供合理出行建议。因此,针对具有非线性和随机性等特性的地铁进出站短时客流预测问题,文章在堆叠式长短时记忆(SLSTM,Stacked Long Short Term Memory)模型的基础上,引入遗传算法(GA,Genetic Algorithm),构建了GA-SLSTM预测模型。以10 min为预测粒度对地铁历史运营数据进行整理,分析了客流变化特征,并将其与GA-循环神经网络(RNN ,Recurrent Neural Network)模型和LSTM模型的预测效果进行对比。GA-SLSTM预测模型对普通站点和换乘站点预测值的决定系数R2的平均值分别达到0.95和0.90,预测值对真实值的拟合效果较好,预测误差低于其他2种模型,证明该方法可提高地铁短时客流预测的准确性。
    Abstract: Short-term passenger flow prediction of urban rail transit can provide important decision-making basis for relevant operation departments to adjust traffic scheduling in real time and improve operation efficiency, and provide reasonable travel suggestions for passengers. Therefore, aiming at the prediction of short-term passenger flow in and out of subway stations with nonlinear and random characteristics, this paper introduced Genetic Algorithm (GA) on the basis of Stacked Long Short Term Memory (SLSTM) network, and constructed a GA-SLSTM prediction model. The paper sorted out the historical operation data of the subway granularity of 10 minutes, analyzed the characteristics of passenger flow changes, and compared their prediction effects with GA-RNN and LSTM network models. The average value of the decision coefficient R2 of GA-SLSTM method for the predicted values of ordinary stations and transfer stations reached 0.95 and 0.90 respectively. The predicted value has a good fitting effect on the real value, and the prediction error is lower than the other two models, which proves that this method can improve the accuracy of short-term passenger flow prediction of subway.
  • 近年来,城市轨道交通因其便捷舒适、绿色低碳等特点受到大众青睐,但大客流也造成了高峰时段站点拥挤、列车晚点等一系列问题[1]。客流的不断增加,使得短时客流预测成为运营部门保障行车安全、优化行车运营效率的关键,同时也为乘客出行规划提供参考依据[2-3]。短时客流预测指预测粒度小于15 min的客流预测,相比中长期预测具有更大的随机性和波动性,预测的准确性也直接关系到城市轨道交通组织运营的高效性和合理性。

    针对城市轨道交通短时客流预测,众多学者研究采用非线性预测方法或组合优化模型的预测方法,证明了对短时客流进行预测的可行性[4-5]。但常用于客流预测问题的卷积神经网络或循环神经网络(RNN ,Recurrent Neural Network)模型受困于梯度消失或梯度爆炸,难以处理存在显著的季节特性、长时间跨度的数据,长短时记忆(LSTM,Long Short Term Memory )模型对这些问题进行了改进。王秋雯等人[6]将LSTM模型与自适应K-means算法结合,并证明了该方法在客流预测问题上的有效性;Liu等人[7]将历史数据分为最近、近期和长期分别输入LSTM模型中 ,提高了预测准确性。预测模型超参数的选择至关重要,影响着模型的好坏,一些研究人员引入优化算法进行优化。仇建华等人[8]使用遗传算法(GA,Genetic Algorithm)优化相关向量机的核函数和核参数;惠阳等人[9]使用粒子群算法优化BP(Back Propagation)神经网络。

    本文引入能有效处理复杂非线性问题、优化初始值和阈值的GA,对堆叠式LSTM(SLSTM,Stacked LSTM)模型的神经网络结构进行优化,构建了GA-SLSTM预测模型。采用该预测模型对车站进出站客流进行预测,以杭州市地铁历史运营数据为例展开试验。对比GA-RNN模型和单层未优化LSTM模型对普通站点和换乘站的客流预测结果,证明了本文方法能够提高短时客流的预测精度。

    LSTM模型在1997年由Hochichreiter和Schmidhuber提出[10],保持了RNN模型的链状结构,改进了RNN模型不能处理长期依赖的情况,并在一定程度上解决了梯度消失的问题,适用于学习具有长期趋势性和周期性的客流序列。LSTM模型单元内部结构增加了遗忘门$ {f_t} $、输入门$ {i_t} $和输出门$ {o_t} $ 3个门限控制,通过Sigmoid函数和点乘操作,限制序列信息的流入,并将上一时刻状态输入下一时刻进行计算,其数学表达式为

    $$ {f_t} = \sigma ({{\boldsymbol{W_f}}} \cdot [{h_{t - 1}},{x_t}] + {b_f}) $$ (1)
    $$ {\widetilde C_t} = \tanh ({{\boldsymbol{W_C}}} \cdot [{h_{t - 1}},{x_t}] + {b_C}) $$ (2)
    $$ {i_t} = \sigma ({{\boldsymbol{W_i}}} \cdot [{h_{t - 1}},{x_t}] + {b_{\boldsymbol{i}}}) $$ (3)
    $$ {C_t} = {f_t}\cdot{C_{t - 1}} + i\cdot {\widetilde C_t} $$ (4)
    $$ {o_t} = \sigma ({W_o}[{h_{t - 1}},{x_t}] + {b_o}) $$ (5)
    $$ {h_t} = {o_t}\cdot\tanh ({C_t}) $$ (6)

    其中,$ {x_t} $t时刻输入数据;$ \sigma $为Sigmoid函数;$\{ {{\boldsymbol{W_i}}},{{\boldsymbol{W_f}}},{{\boldsymbol{W_o}}},{{\boldsymbol{W_C}}}\}$分别为输入门、遗忘门、输出门和细胞状态的参数矩阵;$\{ {b_i},{b_f},{b_o},b_C^{}\}$为输入门、遗忘门、输出门和细胞状态的偏移量;$ {\widetilde C_t} $为候选细胞状态,$ {C_t} $为细胞状态;$ {h_t} $为隐藏状态。

    SLSTM模型中有多个隐藏LSTM层,每层包含多个LSTM单元,可对长期状态进行处理。Graves等人[11]证明了LSTM层级的堆叠比增加内部LSTM单元具有更好的预测性能,可通过加深网络层级解决更加复杂的问题。SLSTM结构层级间的状态转移如图1所示,上层的LSTM结构输出一个隐藏状态序列,输入到下一层结构中,其中,$ C_t^l $$ h_t^l $分别是第lt时刻的细胞状态和隐藏状态。

    图  1  SLSTM神经层状态传递释义

    GA是生物遗传和进化的优化算法,具有较强的全局搜索能力,本文采用GA对SLSTM模型进行优化。主要优化的参数有:SLSTM层数、SLSTM隐藏层每层单元数量、全连接层层数、全连接层每层神经元个数。针对具有非线性和随机性的城市轨道交通短时客流预测问题,建立了GA-SLSTM 预测模型,如图2所示。

    图  2  优化GA-SLSTM模型流程示意

    其中,$ x_s^{(t)} $$ y_s^{(t)} $分别表示st时刻的输入和输出数据,输入前k个时间段的历史数据,得到后z个时间段的预测值。设置SLSTM和全连接层数分别在1~4之间,基本可满足本文实验数据集的需求。初始每层神经元个数为在[32, 256]范围内产生的随机数,进而生成初始种群。根据每个种群的染色体搭建对应神经网络模型,神经网络层级结构从上至下为输入层、SLSTM层、全连接层和输出层。全连接层包括全连接Dense层、防止过拟合的Dropout弃权参数层和用于隐藏层批标准化的Batch Nomalization层。本文采用评价指标均等系数EC作为种群适应度AEC

    $$ A_{{\rm{EC}}} = 1 - \dfrac{{\sqrt {\displaystyle\sum\nolimits_{i = 1}^n {{{(\widehat {{y_i}} - {y_i})}^2}} } }}{{\sqrt {\displaystyle\sum\nolimits_{i = 1}^n {y_i^2} } + \sqrt {\displaystyle\sum\nolimits_{i = 1}^n {\widehat {{y_i}}} } }} $$ (7)

    其中,$ {y_i} $为真实值;$ \widehat {{y_i}} $为预测值。均等系数$A_{{\rm{EC}}} \in [0,1]$,其值越接近1表示预测值越接近真实值,则该个体被选择的概率也越大,下一代种群根据适应度选择个体,并进行交叉、变异操作。本文设置最大种群迭代为20代,重复选择、交叉和变异生成随机种群,并搭建相应模型直至最大种群迭代,输出预测结果AEC值最大的最优个体和相应预测模型。

    由于乘客日常出行具有规律性,站点进出站客流表现出明显的周期性,同时,由于天气、突发活动等随机因素的影响,使其具有波动性。本文以杭州市1号线普通站点西兴站和换乘站火车东站为例分析客流变化特征。

    2019年1月5—25日西兴站3个星期内的客流进站情况如图3所示。从图3中可知,单日内客流随机波动大,1个星期内客流曲线存在相似性,工作日和休息日客流特性呈现出明显差异,工作日表现出双峰型客流特征,休息日表现出明显的无峰型客流特征;星期与星期之间客流变化趋势相似,具有明显的周期性。

    图  3  西兴站进站客流的周期特性

    采用层次聚类算法将1个星期7天客流量作为聚类特征,簇间样本点间距离采用欧式距离计算,生成层次聚类树形图如图4所示,虚线为类别分割线。从图4中可看出,虚线将西兴站1个星期进站客流划分为星期一~星期五和休息日两类,工作日和休息日客流特征分化明显,可将1个星期内的进站客流量分为工作日和休息日2类。而属于换乘站的火车东站工作日与休息日之间客流分布没有明显相似性,每一天客流趋势都被单独划分,与其余几天欧式距离较大。西兴站2个星期之间每日客流的Spearman相关系数如表1所示。从表1中可知,工作日与上个星期工作日间相关系数大,相关系数最大值在上个星期相邻几日间略有浮动,和上个星期工作日的相关系数较小;休息日和上个星期工作日相关性小,星期六和星期日分别与上个星期六和上个星期日相关系数最大,周期性明显。

    图  4  7天内客流层次聚类
    表  1  西兴站2个星期之间客流Spearman相关系数
    星期一星期二星期三星期四星期五星期六星期日
    上个星期一0.9760.9680.9750.9710.9550.7780.623
    上个星期二0.9790.9720.9760.9750.9520.7590.596
    上个星期三0.9700.9720.9730.9650.9550.7840.631
    上个星期四0.9610.9740.9700.9630.9570.7760.628
    上个星期五0.9550.9560.9520.9510.9720.8060.658
    上个星期六0.7680.7760.7750.7780.7890.9350.890
    上个星期日0.6000.6170.6110.6040.6450.8990.965
    下载: 导出CSV 
    | 显示表格

    车站1日内进出站客流体现出固定的客流趋势,分为单峰型、双峰型、全峰型和无峰型,早晚高峰不同时间段和平峰不同时间段间客流存在相似性。图5是星期一不同时间段进站客流层次聚类的散点图,选用刷卡闸机数/min、客流量/min、当前时间段客流量、前后时间段客流量等23维聚类特征映射到多维空间进行聚类。西兴站远离市中心,全天客流量较小,高峰时进站客流量在60 人/min左右,平峰时在5 人/min左右。火车东站属于全峰型客流特征,高峰客流达到150 人/min。虽然不同站点日内客流分布不同,但图5中高峰段和平峰段等不同时间段分类明显。

    图  5  1日内不同时间段进站客流量聚类

    本文采用2019年1月5—25日杭州市地铁AFC系统的历史刷卡记录作为实验数据,共81个站点,每天约200万条刷卡记录。每条刷卡记录的数据包含刷卡时间、用户ID、站台编号闸机设备编号、进出站状态、线路号和支付类型。检查重复值和空值后,整理成10 min为粒度的进出站客流数据样本,整理后共291600个数据样本。将2019年1月5—21日的数据作为训练集,2019年1月22—24日的数据为验证集,对2019年1月25日站点进出站客流进行10 min粒度预测。

    提取乘客进出站时间、星期、每10 min间隔的进出站刷卡闸机的数量和天气等14维基本特征,其中,天气特征包括空气质量、风向、风速、气温和状态(晴、阴、雨)。将1日内每10 min和1个星期内每天客流量聚类结果进行定量转换,提取每类的类别标签、平均值和方差作为1日内和1个星期内时间特征。2个星期之间的时间特征直接提取上个星期Spearman相关系数最大的一天的客流数据。

    图6是对西兴站的预测模型进行GA优化的前11代种群的适应度曲线。可以看出,第4代之后适应度值趋于平稳,第11代种群的适应度基本高于0.9,逐渐收敛于全局最优解。因此,设置最大种群迭代为20代,每代有10个个体。

    图  6  遗传算法优化模型前11代适应度曲线

    为更加直观地衡量预测效果,引入平均绝对误差(MAE ,Mean Absolute Error)、均方根误差(RMSE ,Root Mean Square Error)和决定系数(R2)对预测结果进行评价,计算公式为

    $$ E_{\rm{MAE}} = \frac{1}{n}\sum\nolimits_{i = 1}^n {|{y_i} - \widehat {{y_i}}|} $$ (8)
    $$ E_{\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\nolimits_{i = 1}^n {{{({y_i} - \widehat {{y_i}})}^2}} } $$ (9)
    $$ E_{\rm{R2}} = 1 - \frac{{\displaystyle\sum\nolimits_{i = 1}^n {{{({y_i} - \widehat {{y_i}})}^2}} }}{{\displaystyle\sum\nolimits_{i = 1}^n {{{({y_i} - \overline y )}^2}} }} $$ (10)

    EMAE表示平均预测差值程度,ERMSE表示单位时间间隔平均预测误差的人数,因此E MAEE RMSE越小,预测精确度越高。ER2代表模型对数据的拟合程度,数值越大,预测值越接近真实值。

    LSTM模型是RNN模型的继承和发展,因此选取GA-RNN模型和单层未优化LSTM模型与本文提出的GA-SLSTM预测模型进行对比,每种模型训练3次取预测结果评价指标的平均值。单层LSTM模型的神经元个数在[32, 256]范围内、间隔32的数组中依次选取,以EMAE最小值的预测值作为预测结果。

    不同模型对西兴站的预测值与真实值曲线如图7所示,预测评价指标如表2所示。可见,本文提出的方法各项指标均优于其他方法,预测值更接近真实值,ER2可达0.95。

    图  7  西兴站不同模型预测结果
    表  2  西兴站不同模型预测指标对比

    指标
    GA-SLSTMGA-RNNLSTM
    MAE1平均值22.4222.9038.0836.8425.7023.46
    221.1940.8323.99
    325.0831.6020.70
    RMSE1平均值33.1334.9257.6452.5435.9735.74
    233.5652.3736.48
    338.0847.6034.77
    R21平均值0.950.950.860.880.940.94
    20.950.880.94
    30.940.900.95
    下载: 导出CSV 
    | 显示表格

    不同模型对换乘站火车东站的预测值及真实值曲线如图8所示,预测评价指标如表3所示。由于换乘站客流随机波动大,周期特征不明显,预测准确度低于普通站点。不同模型的预测值基本符合真实值,本文提出的方法各项指标均优于其他方法。

    图  8  火车东站不同模型预测结果
    表  3  火车东站不同模型预测指标对比

    指标
    GA-SLSTMGA-RNNLSTM
    MAE1平均值113.83115.34111.61116.31140.76135.09
    2112.63119.49132.72
    3119.56117.84131.80
    RMSE1平均值157.16161.03163.32162.25185.80178.70
    2159.12155.55175.27
    3166.82167.89175.04
    R21平均值0.900.900.890.900.870.88
    20.900.910.88
    30.890.890.88
    下载: 导出CSV 
    | 显示表格

    实验结果表明,本文提出GA-SLSTM模型能够提高城市轨道交通短时客流预测准确性。引入GA优化神经网络结构,相比手动调参等方式,使得模型更有说服性。优化后的SLSTM预测模型能够学习长序列信息,精确预测客流变化,无论是在普通站点还是在换乘站点,其预测效果都明显优于其他模型。此外,为更好地提高短时客流预测准确性,下一步需对换乘站的大客流数据进行趋势、周期和噪声分解分析及研究,进一步提高换乘站预测准确性。

  • 图  1   SLSTM神经层状态传递释义

    图  2   优化GA-SLSTM模型流程示意

    图  3   西兴站进站客流的周期特性

    图  4   7天内客流层次聚类

    图  5   1日内不同时间段进站客流量聚类

    图  6   遗传算法优化模型前11代适应度曲线

    图  7   西兴站不同模型预测结果

    图  8   火车东站不同模型预测结果

    表  1   西兴站2个星期之间客流Spearman相关系数

    星期一星期二星期三星期四星期五星期六星期日
    上个星期一0.9760.9680.9750.9710.9550.7780.623
    上个星期二0.9790.9720.9760.9750.9520.7590.596
    上个星期三0.9700.9720.9730.9650.9550.7840.631
    上个星期四0.9610.9740.9700.9630.9570.7760.628
    上个星期五0.9550.9560.9520.9510.9720.8060.658
    上个星期六0.7680.7760.7750.7780.7890.9350.890
    上个星期日0.6000.6170.6110.6040.6450.8990.965
    下载: 导出CSV

    表  2   西兴站不同模型预测指标对比


    指标
    GA-SLSTMGA-RNNLSTM
    MAE1平均值22.4222.9038.0836.8425.7023.46
    221.1940.8323.99
    325.0831.6020.70
    RMSE1平均值33.1334.9257.6452.5435.9735.74
    233.5652.3736.48
    338.0847.6034.77
    R21平均值0.950.950.860.880.940.94
    20.950.880.94
    30.940.900.95
    下载: 导出CSV

    表  3   火车东站不同模型预测指标对比


    指标
    GA-SLSTMGA-RNNLSTM
    MAE1平均值113.83115.34111.61116.31140.76135.09
    2112.63119.49132.72
    3119.56117.84131.80
    RMSE1平均值157.16161.03163.32162.25185.80178.70
    2159.12155.55175.27
    3166.82167.89175.04
    R21平均值0.900.900.890.900.870.88
    20.900.910.88
    30.890.890.88
    下载: 导出CSV
  • [1]

    Zhong C, Batty M, Manley E, et al. Variability in Regularity: Mining Temporal Mobility Patterns in London, Singapore and Beijing Using Smart-Card Data [J]. PLoS ONE, 2016, 11(2): e0149222. DOI: 10.1371/journal.pone.0149222

    [2]

    Niu H, Zhou X. Optimizing urban rail timetable under time-dependent demand and oversaturated conditions [J]. Transportation Research Part C: Emerging Technologies, 2013(36): 212-230. DOI: 10.1016/j.trc.2013.08.016

    [3]

    Wu J, Liu M, Sun H, et al. Equity-based timetable synchronization optimization in urban subway network [J]. Transportation Research Part C: Emerging Technologies, 2015(51): 1-18. DOI: 10.1016/j.trc.2014.11.001

    [4]

    Keyu Wen, Guotang Zhao, Bisheng He, at el. A decomposition-based forecasting method with transfer learning for railway short-term passenger flow in holidays [J]. Expert Systems with Applications, 2022, 189(3).

    [5] 陈深进,薛 洋. 基于改进卷积神经网络的短时公交客流预测 [J]. 计算机科学,2019,46(5):175-184. DOI: 10.11896/j.issn.1002-137X.2019.05.027
    [6] 王秋雯,陈彦如,刘媛春. 基于卷积长短时记忆神经网络的城市轨道交通短时客流预测 [J]. 控制与决策,2021,36(11):2760-2770. DOI: 10.13195/j.kzyjc.2020.0501
    [7]

    Liu Y, Liu Z, Jia R. DeepPF: A deep learning based architecture for metro passenger flow prediction [J]. Transportation Research Part C: Emerging Technologies, 2019(101): 18-34. DOI: 10.1016/j.trc.2019.01.027

    [8] 仇建华,尚 凯,张亚岐,等. 基于相关向量机的城市轨道交通突发大客流预测 [J]. 大连交通大学学报,2019(1):13-17. DOI: 10.13291/j.cnki.djdxac.2019.01.003
    [9] 惠 阳,王永岗,彭 辉,等. 基于优化PSO-BP算法的耦合时空特征下地铁客流预测 [J]. 交通运输工程学报,2021,21(4):210-222.
    [10]

    S. Hochreiter, J. Schmidhuber. Long Short-Term Memory [J]. Neural Computation, 1997, 9(8): 1735-1780. DOI: 10.1162/neco.1997.9.8.1735

    [11]

    A. Graves, A. Mohamed, G. Hinton. Speech recognition with deep recurrent neural networks[C]// 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, May 26-31, 2013, Vancouver, BC, Canada. New York, USA: IEEE, 2013: 6645-6649.

  • 期刊类型引用(1)

    1. 何铁军,李建,黄华林,何勇. 城际、地铁列车重大事故灾害一体化救援能力建设. 中国安全生产科学技术. 2021(S2): 54-57 . 百度学术

    其他类型引用(0)

图(8)  /  表(3)
计量
  • 文章访问数:  118
  • HTML全文浏览量:  53
  • PDF下载量:  7
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-01-25
  • 刊出日期:  2022-08-24

目录

/

返回文章
返回