Time-sharing pricing of high-speed railway passenger transport based on passenger travel mode selection
-
摘要: 高速铁路(简称:高铁)客流一天之中具有较大的波动性,呈现出高峰、平峰、低谷的特点。文章利用“削峰填谷”思想,基于分时定价理论和Logit效用函数,考虑旅客选择出行方式的行为因素,以及线路通过能力、客车容量等约束,建立以高铁企业收入最大化为目标的分时定价模型,并利用遗传算法进行求解。通过某铁路线实际算例,验证上述模型和算法的可行性。验证结果表明,高铁分时定价策略有助于提升高铁市场占有率及运营企业客运收益。Abstract: The passenger flow of high-speed railway (abbreviated as high-speed railway) fluctuates greatly in a day, showing the characteristics of peak, flat peak and low peak. Using the idea of "peak clipping and valley filling", based on time-sharing pricing theory and Logit utility function, considering the behavior factors of passengers in choosing travel modes, as well as the constraints of railway carrying capacity and passenger capacity, this paper established a time-sharing pricing model with the goal of maximizing revenue of high-speed railway enterprises and used genetic algorithm to solve it. The feasibility of the above model and algorithm were verified by a practical example of a railway line. The verification results show that the time-sharing pricing strategy of high-speed rail is helpful to improve the market share of high-speed railway and the passenger revenue of operating enterprises.
-
人脸识别是基于图像处理、模式识别等技术,利用人的脸部信息特征,来进行身份验证与鉴别的生物识别技术。人脸识别技术已在交通出行、手机解锁、资质认证等领域得到广泛应用。人脸识别过程一般分为人脸检测与对齐、特征提取、特征匹配检索3个阶段,具体流程如图1所示。
人脸检测与对齐方面,MTCNN[1]在人脸检测的基准数据集FDDB和WIDERFACE,以及人脸对齐的基准数据集AFLW上都取得了较好的测试结果。特征提取方面,2015年,ResNet[2]残差学习被提出后,网络深度不再限制网络性能,大部分特征提取网络都以ResNet为基础做更新优化;DeepID[3]采用LeNet结构对人脸多个关键区域分别做特征提取,将隐藏层特征拼接起来,降维得到最终特征,用于人脸描述和分类;Facenet[4]基于ResNet网络,结合Tripletloss函数,利用欧式嵌入,解决人脸比对验证的问题;SphereFace[5]首次关注特征的角度可分性,使得训练出的卷积神经网络(CNN,Convolutional Neural Networks)能学习具有角度判别力的特征;Insightface算法[6]提出了附加角边距损失函数,直接在角度空间中最大化分类界限。特征匹配检索方面,kd-tree[7]是常用做特征点匹配的Sift[8]算法,Surf[9]算法和ORB[10]算法与SIFT算法相比,特征点检测匹配速度有较大提升,但这些算法的效率均不及GPU环境下为稠密向量提供高效相似度搜索和聚类的Faiss算法。
目前,实名制进站核验系统[11]的人脸识别率已达97%,旅客可以在5 s内完成进站核验,但这只针对票、证、人一致性核验的1v1场景。
综上,本文沿用MTCNN,基于Insightface对原有的ResNet残差单元进行优化,将Faiss框架引入人脸的高维特征匹配过程,从算法的角度,对1vN场景下的搜索匹配过程进行优化,提高模型的效率与适用性。
1 铁路车站人脸识别算法
铁路车站人流密度较大,环境场景复杂,有时需对场景下出现的所有人员进行识别监控。本文采用MTCNN进行人脸检测与对齐,定位出人脸区域,找到脸部基准点之后,用改进的特征提取网络Insightface结合损失函数优化进行人脸特征提取,并将Faiss索引检索引入特征匹配过程,完成人脸识别。
1.1 人脸检测与对齐
1.1.1 MTCNN流程
MTCNN是一个深度级联的多任务CNN框架,具有3阶段深度卷积网络。以从粗略到精细的方式来预测人脸以及人脸关键点位置,可以同时完成人脸分类、边框回归和面部关键点的定位任务。在训练过程中采用困难样本挖掘策略,可以在无需手动选择样本的情况下提高性能。该框架流程如图2所示。
给定一张输入图片,将其缩放至不同比例,构建一个图像金字塔,作为以下3个阶段的网络输入:
(1)通过全卷积网络P-Net(Proposal Network)来获得候选边框和边框回归参数,用回归参数调整边框位置,再用非极大值抑制(NMS,Non-Maximum Suppression)合并重叠率较高的候选框;
(2)将P-Net输出的候选框从输入图片对应位置剪裁出来,输入到R-Net(Refine Network)。该网络进一步过滤掉非人脸的候选框,同样,采用回归参数调整边框位置,再用NMS合并重叠率较高的候选框;
(3)将R-Net输出的候选框从输入图片对应位置剪裁出来,输入到O-Net(Output Network),找出面部的5个关键点,并输出检测到的人脸以及面部关键点的位置。
1.1.2 MTCNN损失函数
训练时,框架的每个阶段都有3个输出:人脸分类,边框回归,面部关键点定位。
(1)人脸分类:是一个二分类问题,损失函数采用交叉熵来表示。
Lidet (1) 其中,
{p_i} 表示第i个样本预测为人脸的概率;y_i^{\det } \in {\rm{\{ 0,1\} }} ,表示第i个样本的真实值。(2)边框回归:对于每个候选框,预测其与最近标注框的偏移量,损失函数采用欧式距离损失进行计算。
L_{{i}}^{box} = \left\| {\hat y_i^{box} - y_i^{box}} \right\|_2^2 (2) 其中,
\hat y_i^{box} 表示网络输出的回归目标值,y_i^{box} 表示真实的回归目标值。(3)面部关键点定位:损失函数同样采用欧式距离损失进行计算。
L_i^{landmark} = \left\| {\hat y_i^{landmark} - y_i^{landmark}} \right\|_2^2 (3) 其中,
\hat y_i^{landmark} 表示网络输出的面部关键点坐标值,y_i^{landmark} 表示真实坐标值。(4)总体损失函数如下:
\min \sum\nolimits_{i = 1}^N {\sum\nolimits_{j \in (\det ,box,landmark)} {{\alpha _j}\beta _i^jL_i^j} } (4) 其中,N表示样本的数量,
{\alpha _j} 表示各层网络的权重,某个网络越重要则所对应的值越大,\,\beta _i^j 表示样本的类型。(5)困难样本挖掘:本文在人脸分类的训练过程中,采用在线困难样本挖掘策略。将训练集中一部分数据集的所有样本,按前向传播中产生的损失大小进行降序排列,取前70%作为困难样本,在反向传播中仅用这些样本来更新参数。
1.2 人脸特征提取
1.2.1 特征值提取网络
将人脸对齐关键点坐标结合改进后的ResNet网络进行深度特征提取。本文对网络原有的残差单元结构做了修改,将原ResNet残差单元(图3a)中的第2个卷积层步长调整为2,并在每次卷积前后都增加批归一化处理(BatchNorm),激活函数在ReLu的基础上增加部分参数,修改小于0的饱和区为非饱和区,称之为PReLu(图3b)。批归一化利于网络收敛,能更好地学习特征表达,非线性激活函数PReLu相比ReLu,有更大范围的非饱和区,有效避免了随着网络深度增加、梯度衰减,引起参数不更新的问题。
1.2.2 特征值提取损失函数
利用Insightface算法根据全连接层的情况确定不同类别的分类边界。在二分类场景下,
{\theta _i} (i=1,2)表示学习的特征向量和类{C_i} 的权重向量之间的角度,假设有类别{C_{\rm{1}}} 、{C_{\rm{2}}} ,特征向量属于{C_{\rm{1}}} 分类的需要满足余弦决策裕度cosθ1>cosθ2的要求,从而区分来自不同类的特性。同时,可通过在余弦空间中增加额外的边缘来加强对习得特征的识别,进一步要求cosθ1>cosθ2+m,m表示决策边界的边距,来控制余弦决策裕度的大小,这个约束对于分类来说更加严格,具有更好的几何解释性,适用于类别较多的人脸分类场景。同时,分类的条件对于角度来说也变得更为苛刻,拉大了类间距离,能够带来更好的区分效果。设b为批尺寸;n为类别区分的具体数量;s表示比例缩放的超参数,改进后的损失函数为:L = - \dfrac{1}{b}\sum\limits_{i = 1}^b {\log \dfrac{{{e^{s(\cos ({\theta _{{y_i}}} + m))}}}}{{{e^{s(\cos ({\theta _{{y_i}}} + m))}} + \displaystyle\sum\nolimits_{j = 1,j \ne {y_i}}^n {{e^{s\cos ({\theta _j})}}} }}} (5) 其中,对特征向量与权重都做了归一化处理,在原本的余弦边距中,cosθ1>cosθ2+m代表分类正确,现在要求当θ2∈[0,π−m]时,cosθ1>cos(θ2+m) 才是分类正确。相当于决策边界由余弦空间延伸到了角度空间,增强了模型对人脸的表征能力。
1.3 人脸特征匹配
提取出的人脸图片高维特征向量无论是分类还是比对验证,都需要进行向量匹配搜索与相似度判断。Faiss是为稠密向量提供高效相似度搜索和聚类的框架,包含对任意大小向量集的搜索算法,可以扩展到单个服务器上主存储器中的数十亿个向量。Faiss是围绕索引展开的,不管运行搜索还是聚类,都要建立一个索引,其特点为:
(1)速度快,可存在内存和磁盘中;
(2)提供多种检索方法;
(3)由 C++实现,提供了Python封装接口;
(4)支持GPU。
2 实验验证
2.1 实验环境
本地服务器测试工具为Jmeters,远程服务器测试工具为wrk,两者均为开源性能测试工具
特征提取对比实验并发用户数量为1 ~ 10,实例数量为1 ~ 40,以Face++提供的API测试效果为参照,测试Insightface在并发条件下的效率与精度;特征匹配对比实验特征底库大小为1万,随机搜索数量为1000,比较传统的kd-tree搜索和本文使用的Faiss向量搜索的性能。
2.2 Insightface特征提取实验
2.2.1 Insightface特征提取效率
远程服务器区分为需要部署Nginx的跳板机以及部署工程和多实例的主机。为消除网络的影响,需要在跳板机上安装wrk,进行性能测试。使用Gunicorn单用户不并发时,每秒事务处理量(TPS,Transaction Per Second)约为7.84个,如表1所示。平均响应时间约为128 ms,比Face++的extract_with_detect接口效率提高1倍以上,如表2所示。在多用户并发情况下,受限于机器配置,同时启用的实例数不宜过多,每个用户的请求次数对TPS没有明显影响,反而会增加延时。考虑到人脸识别核验系统应用都是基于远程重点人员特征库,远程特征提取的效率尤为重要。试验证明以Gunicorn调用flask的方式构建Insightface特征提取服务器,与单用户请求相比性能没有明显损失。
表 1 Insightface性能测试情况模拟线程
(用户)数模拟
连接数实例个数 TPS/个 平均响应时间/ms CPU
使用率1 1 1 7.84 128 28 1 2 1 9.19 217 28 1 4 1 9.19 431 28 1 1 2 8.24 120 28 1 2 2 11.54 173 51 1 4 2 12.19 326 53 1 10 2 11.99 818 53 1 1 3 7.79 128 28 1 2 3 11.64 170 51 1 4 3 8.29 478 45 表 2 Insightface与Face++的特征提取效率对比算法 耗时/ms Insightface 128 Face++ 300~400 2.2.2 Insightface特征提取精度
精度测试基于LFW(Labled Faces in the Wild)数据集,使用旷视Face++的API接口做精度参照。1v1测试按人物名取每相邻2张图片特征组成一对,每张图只组对一次,共6000对。1vN测试选取数据集中图片数量在2张以上的1680人,共9064张图片,每人随机抽取1张作为后续对比图,其余作为底库特征集。测试结果如表3、表4所示。
(1)1v1比对测试
1v1是指同一个特征底库图数量为1的情况。Insightface采取10折交叉验证得到1个比对精度,Face++根据提供的4个置信度参考阈值[55.013874,62.088215,67.57555,71.71891]得到1组比对精度,如表3所示。由测试结果可知,Insightface 1v1算法精度优于Face++。
表 3 1v1情况下Insightface与Face++测试结果对比算法 精度 Insightface 0.99767±0.00281 Face++ [0.99283333, 0.99733333, 0.997, 0.99416667] (2)1vN比对测试
1vN是指同一个人特征底库图数量为N的情况。Insightface提供了1组10个特征的距离阈值,1vN的比对精度最佳可达95.23%,与Face++检索算法精度基本相同,如表4所示。
表 4 1vN情况下Insightface与Face++测试结果对比算法 阈值 精度 Insightface [0.24,0.44,0.64,0.84,1.04,
1.24,1.44,1.64,1.84,2.04][0.0305,0.3181,0.6927,0.8887,0.9383,
0.9504,0.9523,0.9523,0.9523,0.9523]Face++ [70,72,74,76,78,80,82,84,
86,88][0.9619,0.9619,0.9619,0.9619,0.9619,
0.9619,0.9619,0.9619,0.9619,0.9595]2.2.3 Faiss特征匹配
kd-ree搜索将底库图片特征划分为多个特征空间,构成二叉树,然后将待对比图片的特征向量传入二叉树进行搜索,返回距离小、相似度高的底库标签。Faiss搜索以向量或矩阵的形式准备好底库特征数据,然后构建底库索引并将特征数据映射至索引中,再通过索引搜索得到标签,两者的搜索性能测试结果对比如表5所示。
表 5 Faiss与kd-tree搜索性能对比测试搜索方法 底库大小 搜索数量 耗时/s kd-tree 10000 1000 8.35 Faiss 10000 1000 0.05 kd-tree在底库大小为1万张图片,随机搜索1000张图片的情况下,总耗时为8.35 s。Faiss在相同情况下,总耗时为0.05 s。大部分人脸核验系统都是基于公安机关的远程重点人员特征库,远程特征匹配的效率尤为重要,本文以Gunicorn调用flask的方式构建Faiss特征搜索服务,不仅在效率上提速了100倍以上,且需要的CPU资源更少。
2.3 实验结论
实验结果表明:(1)以Gunicorn调用flask的方式构建Insightface特征提取服务器,虽然在高并发、多实例的场景下,有较高的硬件资源要求,但是精度和效率都有所提高;(2)以Gunicorn调用flask的方式构建Faiss特征搜索服务器,相比传统的kd-tree搜索,效率上提高了100倍以上,而且需要占用的CPU资源更少。
3 结束语
Insightface结合Faiss的高并发人脸识别,通过对实际应用场景的模拟,结合具体的软硬件资源限制,优化了人脸识别特征提取和特征匹配流程的算法设计方案,为铁路客运高并发情况下的人脸识别、核验、搜索比对等安全保障业务提供了技术支撑。该方法在细粒度人脸检测、更高效率的人脸特征提取、比对、搜索以及多种站场复杂条件下的适用性等方面,有进一步优化空间。未来可通过复杂场景下人脸图片数据的积累,算法框架调优等方式,进一步提高适用性。
-
表 1 各OD现行票价范围
OD 价格/元 OD 价格/元 1—2 26~39 2—3 17~25 1—3 43~64 2—4 23~34 1—4 49~73 3—4 6~9 表 2 各OD现行客流情况
客流量/人 OD 1—2 1—3 1—4 2—3 2—4 3—4 铁路全天客流 4 987 2 856 4 490 366 850 384 高峰客流总数 3 483 2 070 3 040 224 506 221 平峰客流总数 1 168 638 1 167 116 238 138 低谷客流总数 336 148 283 26 106 25 表 3 平峰时段旅客对运输属性的偏好权重情况
运输方式 经济性 便利性 舒适性 运输时间 高铁 −0.041 0.236 0.069 −0.014 长途汽车 −0.192 0.489 −0.063 0.012 私家车 −0.002 1.256 0.063 −0.007 表 4 所有OD等比例折扣降价的客流量及总收入统计
详情 OD 1—2 1—3 1—4 2—3 2—4 3—4 总计 高峰票价/元 39 64 73 25 34 9 高峰客流/人 3 077 1 733 2 544 191 481 215 8 241 平峰票价折扣率/% 93.5 93.5 93.5 93.5 93.5 93.5 平峰票价/元 36.5 60 68 23 32 8.5 平峰客流/人 1 658 1 001 1 707 149 252 139 4 906 低谷票价/元 26 43 49 17 23 6 低谷客流/人 403 178 340 34 127 30 1 112 全天总客流/人 5 138 2 912 4 591 374 860 384 14 259 全天客流变化/% 3.0 2.0 2.2 2.2 1.2 0.0 2.3 全天总收入/元 190 998 178 626 318 448 8 780 27 339 3 297 727 488 全天收入变化/% 14.3 11.2 15.3 9.7 14.5 5.2 13.9 表 5 最高票价的OD等比例折扣降价方案的客流量及总收入统计
详情 OD 1—2 1—3 1—4 2—3 2—4 3—4 总计 高峰票价/元 采用原定价方案 64 73 采用原定价方案 采用原定价方案 采用原定价方案 高峰客流/人 1 733 2 544 平峰票价折扣率/% 88.0 88.0 平峰票价/元 56.5 64 平峰客流/人 1 035 1 849 低谷票价/元 43 49 低谷客流/人 178 340 全天总客流/人 4 987 2 946 4 733 366 850 384 14 266 全天客流变化/% 0.0 3.2 5.4 0.0 0.0 0.0 2.4 全天总收入/元 167 042 177 043 320 708 8 004 23 868 3 133 699 798 全天收入变化/% 0.0 10.2 16.1 0.0 0.0 0.0 9.5 -
[1] 朱颖婷,王富章,单杏花,等. 铁路客运票价策略研究综述 [J]. 铁路计算机应用,2014,23(6):29-34. DOI: 10.3969/j.issn.1005-8451.2014.06.007 [2] Mcgill, J. I., Van Ryzin, G. J. Revenue Management: Research Overview and Prospects [J]. Transportation Science, 1999, 33(2): 233-256.
[3] 宋文波,赵 鹏,李 博,等. 高铁动态定价的稳健优化模型 [J]. 哈尔滨工业大学学报,2018,50(9):25-30. DOI: 10.11918/j.issn.0367-6234.201706073 [4] 李静帆. 基于班列开行决策的铁路客运动态定价模型研究[D]. 成都: 西南交通大学, 2016. [5] 张小强,李 煜,黄帅勋,等. 基于最大凹向包络的高铁客运动态定价策略 [J]. 交通运输系统工程与信息,2016,16(6):1-8. DOI: 10.3969/j.issn.1009-6744.2016.06.001 [6] 张 田. 航空竞争下我国高铁定价策略研究[D]. 重庆: 重庆交通大学, 2016. [7] 周 焱,李鹏飞,朱绪斐,等. 竞争条件下高铁定价方法研究 [J]. 交通运输工程与信息学报,2016,1(14):101-106. [8] Sibdari S, Lin K Y, Chellappan S. Multiproduct Revenue Management: An Empirical Study of Auto Train at Amtrak [J]. Journal of Revenue and Pricing Management, 2008, 7(2): 172-184.
[9] 李 博. 高铁票额分配和分时定价优化研究[D]. 北京: 北京交通大学, 2019. [10] 刘万明. 我国高铁客运专线主要技术经济问题研究[D]. 成都: 西南交通大学, 2002. -
期刊类型引用(17)
1. 黄星源,宁安安,胡安明. 大语言模型在高校招生咨询服务中的应用研究. 电脑与信息技术. 2025(02): 122-129 . 百度学术
2. 胡修齐. 无感知人脸识别智能考勤系统设计与应用. 电子元器件与信息技术. 2025(03): 213-215 . 百度学术
3. 冯建,方鹏,赵海波,张明帅. 端边云一体化智慧地铁列车司乘监测系统设计. 控制与信息技术. 2025(02): 65-72 . 百度学术
4. 李博,朱建生,戴琳琳,景辉,黄植正. 铁路客运场景下基于图像搜索的遗失物品查找方法. 铁道运输与经济. 2024(05): 89-99 . 百度学术
5. 武凌,黄淑芹,陈劲松,周健. 基于深度学习语义匹配的通用智能问答系统的设计与实现. 安庆师范大学学报(自然科学版). 2024(02): 84-89 . 百度学术
6. 周巧扣. 基于BERT模型的自动问答系统的设计与实现. 现代信息科技. 2024(20): 83-86 . 百度学术
7. 景辉,戴琳琳,候亚伟,朱宇豪,随玉腾. 基于光照自适应调节和模糊分类的人脸图像质量提升算法研究. 铁路计算机应用. 2023(02): 1-6 . 本站查看
8. 吕占民,李士达,戴琳琳,宋春晓,董兴芝. 基于AR智能眼镜的免打扰列车验票应用研究. 铁路计算机应用. 2023(05): 64-67 . 本站查看
9. 董亚蕾,张师宁,武旭聪. 基于小人脸识别的高校课堂考勤系统研究. 现代信息科技. 2023(12): 62-65 . 百度学术
10. 傅荟瑾,史天运,王瑞,马祯,张万鹏. 基于改进ByteTrack的高铁周界入侵监测方法研究. 仪器仪表学报. 2023(04): 61-71 . 百度学术
11. 朱宇豪,李平,戴琳琳,景辉,董兴芝. 基于知识迁移的旅客人脸图像异常检测方法研究. 铁路计算机应用. 2023(06): 7-13 . 本站查看
12. 王彪,毋涛. 基于卷积神经网络的面料检索系统. 计算机技术与发展. 2023(09): 52-56 . 百度学术
13. 刘瑞昊,于振中,孙强. 基于深度学习的织物图像检索系统研究. 棉纺织技术. 2022(05): 42-47 . 百度学术
14. 李贝贝,朱建生,阎志远,戴琳琳,候亚伟. 铁路客票系统人像检索平台构建与关键技术研究. 铁道运输与经济. 2021(05): 58-63+91 . 百度学术
15. 王雪峰,董兴芝,原非凡. 京张高铁旅客全行程智慧信息服务技术研究与应用. 铁路计算机应用. 2021(07): 50-55 . 本站查看
16. 王仲林,王卫民,朱乐俊. Siamese-ELECTRA网络结合对抗训练的FAQ问答模型研究. 软件导刊. 2021(08): 58-64 . 百度学术
17. 单杏花,张志强,宁斐,李士达,戴琳琳. 中国铁路电子客票关键技术应用与系统实现. 中国铁道科学. 2021(05): 162-173 . 百度学术
其他类型引用(9)