High-speed railway gale prediction model and algorithm based on LSTM
-
摘要: 通过对风速数据进行时间序列分析,建立风速预测模型,实现大风灾害的预警,对提升高铁运营安全保障能力具有重要意义。通过分析某高铁客运专线防灾系统的历史风速数据,建立了一种基于LSTM神经网络的大风预测模型,使用TensorFlow平台进行模型参数训练,并结合实际监测数据进行了模型验证。结果表明,该方法预测未来20 min的大风效果较好,预测20~30 m/s大风时的平均误差为13.4%。该研究可为高铁大风预警技术的应用提供参考。
-
关键词:
- 高速铁路 /
- 大风 /
- 风速预测 /
- 长短期记忆(LSTM) /
- TensorFlow
Abstract: Through the time series analysis of gale speed data, this paper established gale speed prediction model to implement the early warning of gale disaster, which was of great significance to improve the operation safety supportability of high-speed railway. The paper analyzed the historical gale speed data of the disaster prevention system of a high-speed railway passenger dedicated line, established a gale prediction model based on LSTM neural network, used TensorFlow platform to train the model parameters, and verified the model with the actual monitoring data. The results show that this method has a good effect in predicting the gale in the next 20 minutes, and the average error of 20 ~ 30 m / s gale prediction is 13.4%. The research can provide reference for the application of high-speed railway gale early warning technology.-
Keywords:
- high-speed railway /
- gale /
- gale speed prediction /
- LSTM(Long Short-Term Memory) /
- TensorFlow
-
目前,我国已在高速铁路沿线全面布设了风速风向传感器,为高铁列车运行提供实时风速风向监测报警数据。高铁防灾系统具备了大风实时监测报警功能[1],但尚不具备预警功能,灾害预警能力不足。如果系统能够通过当前时刻的风速数据,预测未来一段时间的风速值,进而对大风做出预警,就能让调度和工务人员提前做好应急处置准备,更好地保障高铁运营安全。
近年来,关于铁路大风预警的研究主要以铁路监测的大风数据为基础,采用时间序列等方法开展风速预测,相关学者已经做了大量工作。其中,刘辉等人开展了基于时间序列的非平稳ARIMA预测模型、卡尔曼滤波、小波分析与神经网络结合等铁路风速预测方法[2-3];王瑞等人[4-5]研究了基于RBF神经网络的铁路沿线短时风速预测方法。铁路大风预警的方法还包括气象学模式、遥感预测模式、专家系统预测模式、时间序列解析预测模式、神经网络预测模式、时间序列与神经网络结合、气象模式与神经网络结合等[6-12]。以上研究中,基于ARIMA和卡尔曼滤波的模型较简单,但预测结果精度一般;小波模型需要预先选择小波种类,且对非平稳数据的处理效果一般;RBF神经网络秒级预测相对误差较小,分钟级以上的预测效果一般。
本文通过建立长短周期记忆(LSTM,Long Short Term Memory)[13]神经网络模型,利用其拥有长短期记忆的特点,增加风速预测的时间尺度,并通过数据分析、试验验证,建立在20 min、30 min及1 h的时间尺度下带有置信度计算的大风预警模型,可为大风灾害的应急处置工作提供参考。
1 高铁防灾中风速的采集
1.1 风速采集装置原理及参数
从安全、便于维护的角度,高铁防灾普遍采用非机械式的超声波风速风向仪(无桨叶或风杯)作为风速采集装置,与气象部门普遍采用的机械式传感器有所区别。声音在空气中的传播速度会与风向上的气流速度叠加,超声波风速风向仪利用超声波时差法,计算风速,采样频率为1 Hz,具体参数如表1所示。
表 1 超声波风速风向仪具体参数风速量程 0~60 m/s 风速分辨率 0.1 m/s 风速准确度 风速为0~35 m/s时:±0.3 m/s或3%(较高者为准)
风速为35~60 m/s时:±5%风向量程 0~360° 风向分辨率 1° 风向准确度 ±3° 1.2 风速采集装置的布设
高铁防灾系统中风速采集装置安装于铁路沿线,一般间隔5~10 km,现场安装如图1所示。
风速采集装置面向田野侧,固定于铁路轨旁的接触网杆4 m高处,采用双传感器冗余配置。传感器安装高度及位置有利于更准确的测量风对经过列车的影响。由于临近地表,风速风向受地形地貌影响较大,与高空风数据差异明显,无法直接采用气象部门的气象站数据作为参考。
2 预测模型及算法
2.1 LSTM神经网络模型
风速的时序变化,既受短期内湍流因素的影响,又受到中长期温度、气压等因素的影响。LSTM神经网络作为一种特殊的循环神经网络,其通过记忆存储单元的设计,能够有效避免梯度消失与爆炸。因此,本文基于LSTM神经网络构建风速预测模型,能够较好地描述风速变化的长短期特征,从而对风速值进行更精准地预测。LSTM神经网络结构如图2所示。
其中,xt-1、xt、xt+1为输入的时间序列;c为变化较为缓慢的传输状态;h为变化较快的传输状态;yt-1、yt、yt+1为输出的预测时间序列;zf、zi、zo为遗忘门、输入门、输出门的门控状态,通过Sigmoid函数将输入数据转换到(0,1)之间;z将对应时刻数据通过tanh激活函数转换到(−1,1)之间。yt为t时刻归一化后的预测结果,可由
$ {W}^{'} $ 同$ {c}^{t} $ 与$ {h}^{t} $ 组成的增广矩阵的乘积进行Sigmoid激活求得,其中,$ {W}^{'} $ 为参数矩阵,其参数值将在训练中迭代更新。具体公式如下:$$ {c}^{t}={z}^{f}\odot {c}^{t-1}+{z}^{i}\odot {z} $$ (1) $$ {h}^{t}={z}^{o}\odot {\mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}(c}^{t}) $$ (2) $$ {\mathrm{y}}^{t}={\rm{sigmoid}}\left({W}^{'}\left({c}^{t}|{h}^{t}\right)\right) $$ (3) 其中,⊙指将矩阵对应元素相乘的运算。
2.2 风速预测训练网络架构
本文采用1层LSTM、1层Dropout、1层Dense全连接作为风速时间序列预测的网络架构。采用当前时刻之前的10个20 min平均风速记录作为输入序列x(xt-9, xt-8,···, xt),预测未来20 min的平均风速yt+1。(1)由于神经网络中模型参数较多,大风样本的数量有限,因此,直接使用风速数据训练LSTM模型容易造成过拟合。虽然在训练模型训练集上,损失函数小,拟合效果较好,但在测试数据上损失较大,预测准确率下降;(2)Dropout是深度网络中常见的一种正则化技巧,在训练网络结构中添加Dropout层,在每次训练的前向传播中以一定概率使部分神经元停止作用,增强模型的泛化能力;(3)使用Dense层将多个神经元的结果作为输入进行加权和输出,从而计算出预测数据。
2.3 风速预测值置信度计算
将预测风速的误差视为高斯分布,其中,预测值作为期望,拟合标准差作为该高斯分布的标准差。设预警阈值为A,预测值为H,拟合标准差为σ,则预测风速为x时,置信度φ计算公式如下:
$$ \varphi = 1 - \int _{ - \infty }^A\frac{1}{{\sigma \sqrt {2 } {\text{π}}}}{e^{ - \frac{{{{(x - H)}^2}}}{{2 {\sigma ^2}}}}}dx $$ (4) 3 数据分析
3.1 计算方法
本文选取了有代表性的某高速铁路客运专线某日包含大风报警在内的12 h风速数据。按1 h、30 min、20 min时间尺度分组,计算整段时间平均风速
$\overline X$ ,以及序列t时刻对应时间尺度的平均风速${{X}}^{t}$ ,进而计算自相关系数、偏自相关系数。k阶自相关系数Rk计算公式:
$$ {{{R}}_k} = \frac{{\sum\nolimits_{{{t}} = 1}^{{{n}} - {{k}}} {({X^t} - \overline X )} ({{{X}}^t} - \overline X )}}{{\sum\nolimits_{{{t}} = 1}^n {{{({X^t} - \overline X )}^2}} }} $$ (5) k阶偏自相关系数ρk计算公式:
$${\rho _k} = \frac{{{{E}}\left[ {\left( {{X^t} - \overline {{X^t}} } \right)\left( {{X^{t - k}} - \overline {{X^{t - k}}} } \right)} \right]}}{{E[{{({X^{t - k}} - \overline {{X^{t - k}}} )}^2}]}} $$ (6) 3.2 分析结果
使用Python进行计算,并调用Matplotlib可视化分析结果。如图3~图5可知,各组不同时间尺度的平均风速在12 h内为非平稳数据,自相关系数及偏自相关系数均为拖尾。由一阶自相关系数可知,20 min时间尺度平均风速的自相关性较强,30 min时间尺度平均风速的自相关性中等,1 h时间尺度平均风速的自相关性较弱。平均风速的时间间隔越长,相关性越小。因此,利用历史平均风速预测未来平均风速的方法时,采用20 min的时间尺度效果较好,否则将出现较大偏差。
4 试验验证
4.1 试验数据及分组
本文采用某高铁客运专线铁路防灾系统大风时段416 400 s的历史数据作为样本,样本数据特征如表2所示。
表 2 样本数据特征指标名称 数值/m·s−1 最小风速 0.0 最大风速 29.2 平均风速 5.4 标准差 3.8 25百分位数 2.4 50百分位数 4.5 75百分位数 7.7 对每20 min的样本数据求平均值,共得到347个数据,作为时间序列。取前200个作为训练数据集,后100个作为测试数据集,剩余数据做为验证数据集。将均方误差(MSE,Mean Square Error)作为代价函数的输出误差。
4.2 模型训练及结果验证
本文使用TensorFlow搭建预测模型,并将分组数据导入,进行模型训练及结果验证。试验结果如图6所示,纵坐标为风速值,横坐标为20 min间隔的时间序列;蓝色曲线为每20 min的平均风速序列,绿色曲线为训练数据集,黄色为测试结果,红色为验证数据集结果。
本次测试验证集MSE为16.65 (m/s)2。多次实验结果显示:在20~30 m/s风速值下,测试集MSE在15~20 (m/s)2之间,拟合标准差在3.87~4.47 m/s,风速预测平均误差13.4%。如选取大风预警的阈值为15 m/s,拟合标准差采用4.2 m/s,当未来20 min的平均风速预测为16 m/s时,大风预警的置信度可根据公式(4)计算得
$ \varphi \approx 0.77 $ ,在预测风速的同时,提供了大风预警的置信度,使预测结果更具参考价值。5 结束语
本文介绍了现有高铁防灾系统中风速数据的采集方法,基于历史大风数据进行统计分析,建立LSTM模型来预测未来短时间内风速平均值,并提供预警置信度。能较好地预测未来20 min平均风速趋势变化,并且在大风速情况下依然保持较高的准确度,预测20~30 m/s大风时平均误差为13.4%。本研究旨在充分利用现有高铁防灾系统数据基础上,提供大风预测并提高预测模型精度。为更加精准地做好大风灾害的预报工作,仍需考虑与气象大数据相结合,进行多模式融合分析。
-
表 1 超声波风速风向仪具体参数
风速量程 0~60 m/s 风速分辨率 0.1 m/s 风速准确度 风速为0~35 m/s时:±0.3 m/s或3%(较高者为准)
风速为35~60 m/s时:±5%风向量程 0~360° 风向分辨率 1° 风向准确度 ±3° 表 2 样本数据特征
指标名称 数值/m·s−1 最小风速 0.0 最大风速 29.2 平均风速 5.4 标准差 3.8 25百分位数 2.4 50百分位数 4.5 75百分位数 7.7 -
[1] 王大卫,白广争. 铁路防灾系统中风雨报警判断的算法实现 [J]. 铁路计算机应用,2012,21(8):6-8. DOI: 10.3969/j.issn.1005-8451.2012.08.002 [2] Liu H, Tian HQ, Li YF. Short-term forecasting optimization algorithms for wind speed along Qinghai-Tibet railway based on different intelligent modeling theories [J]. Journal of Central South University of Technology (English Edition), 2009, 16(4): 690-696. DOI: 10.1007/s11771-009-0114-3
[3] 刘 辉,田红旗,李燕飞. 基于小波分析法与神经网络法的非平稳风速信号短期预测优化算法 [J]. 中南大学学报(自然科学版),2011,42(9):2704-2711. [4] 王 瑞. 铁路防灾安全监控系统中风速预测与地震监测技术研究[D]. 北京: 中国铁道科学研究院, 2011. [5] 王 瑞,史天运,王 彤. 基于RBF神经网络的铁路沿线短时风速预测方法 [J]. 中国铁道科学,2011,32(5):132-134. [6] 李文良,卫志农,孙国强. 基于改进空间相关法和径向基神经网络的风电场短期风速分时预测模型 [J]. 电力自动化设备,2009,29(6):89-92. DOI: 10.3969/j.issn.1006-6047.2009.06.020 [7] 马韫娟,马淑红,李振山,等. 我国客运专线高速列车安全运行大风预警系统研究 [J]. 铁道工程学报,2009(7):43-47. DOI: 10.3969/j.issn.1006-2106.2009.07.010 [8] 潘迪夫,刘 辉,李燕飞. 基于时间序列分析和卡尔曼滤波算法的风电场风速预测优化模型 [J]. 电网技术,2008,32(7):82-86. [9] 丁 明,张立军,吴义纯. 基于时间序列分析的风电场风速预测模型 [J]. 电力自动化设备,2005,25(8):32-34. DOI: 10.3969/j.issn.1006-6047.2005.08.007 [10] 郭 鹏. 双自回归滑动平均模型风速预测研究 [J]. 现代电力,2009(6):66-69. DOI: 10.3969/j.issn.1007-2322.2009.06.015 [11] 周培毅,张新燕. 基于时间序列与支持向量机的风电场风速预测研究 [J]. 陕西电力,2009(12):1-4. [12] 傅 蓉,王维庆,何桂雄. 基于气象因子的BP神经网络风电场风速预测 [J]. 可再生能源,2009,27(5):86-89. DOI: 10.3969/j.issn.1671-5292.2009.05.020 [13] Hochreiter S, Schmidhuber J. Long Short-Term Memory [J]. Neural Computation, 1997, 9(8): 1735-1780. DOI: 10.1162/neco.1997.9.8.1735
-
期刊类型引用(3)
1. 过加锦,李磊,任俞霏,马祯. 融合信号分解与排列熵的高铁线路风速区间预测方法. 交通科技与经济. 2023(04): 74-80 . 百度学术
2. 王瑞,马祯,李磊. 基于CEEMDAN-WOA-SVR的高铁沿线超短期风速预测方法. 中国铁道科学. 2023(06): 80-86 . 百度学术
3. 杨建伟,陈中雷,马祯,沈敬伟,包云. 高速铁路灾害监测数据分析应用研究. 铁路计算机应用. 2022(03): 19-23 . 本站查看
其他类型引用(10)