• 查询稿件
  • 获取最新论文
  • 知晓行业信息
官方微信 欢迎关注

基于回归学习算法的高铁站媒体资源价值评估模型研究与应用

许娜, 单杏花, 付睿, 吴刚, 牛慧琳

许娜, 单杏花, 付睿, 吴刚, 牛慧琳. 基于回归学习算法的高铁站媒体资源价值评估模型研究与应用[J]. 铁路计算机应用, 2022, 31(12): 20-25. DOI: 10.3969/j.issn.1005-8451.2022.12.04
引用本文: 许娜, 单杏花, 付睿, 吴刚, 牛慧琳. 基于回归学习算法的高铁站媒体资源价值评估模型研究与应用[J]. 铁路计算机应用, 2022, 31(12): 20-25. DOI: 10.3969/j.issn.1005-8451.2022.12.04
XU Na, SHAN Xinghua, FU Rui, WU Gang, NIU Huilin. Media resource value evaluation model of high-speed railway station based on regression learning algorithm[J]. Railway Computer Application, 2022, 31(12): 20-25. DOI: 10.3969/j.issn.1005-8451.2022.12.04
Citation: XU Na, SHAN Xinghua, FU Rui, WU Gang, NIU Huilin. Media resource value evaluation model of high-speed railway station based on regression learning algorithm[J]. Railway Computer Application, 2022, 31(12): 20-25. DOI: 10.3969/j.issn.1005-8451.2022.12.04

基于回归学习算法的高铁站媒体资源价值评估模型研究与应用

基金项目: 中国铁道科学研究院集团有限公司科研项目重点课题(2019YJ119)
详细信息
    作者简介:

    许 娜,工程师

    单杏花,研究员

  • 中图分类号: U291.6 : TP39

Media resource value evaluation model of high-speed railway station based on regression learning algorithm

  • 摘要: 随着高速铁路(简称:高铁)车站媒体广告市场的兴盛,亟需一种科学、系统、全面的高铁站媒体资源价值评估体系指导媒体资源经营。文章研究价值评估指标体系的多维度数据与高铁站媒体资源价值的关系,借助特征工程,抽取出与目标强相关的核心数据特征。运用多种回归学习算法,筛选出评价指标最优的极限梯度提升(XGBoost)算法,构建高铁站媒体资源价值评估模型,通过模型优化,提升了拟合优度值,达到目标值0.8。应用证明,该模型偏离度不超过15%,可为高铁站媒体资源日常经营定价决策提供参考。
    Abstract: With the prosperity of high-speed railway station media advertising market, a scientific, systematic and comprehensive evaluation system of high-speed railway station media resource value is urgently needed to guide the management of media resources. This paper studied the relationship between the multi-dimensional data of the value evaluation index system and the value of high-speed railway station media resources, with the help of feature engineering, extracted core data features that were strongly related to the target. Using a variety of regression learning algorithms, the paper selected the eXtreme Gradient Boosting (XGBoost) algorithm with the best evaluation index, and constructed the value evaluation model of high-speed railway station media resources. Through model optimization, the goodness of fit value was improved to reach the target value of 0.8. The application proves that the deviation degree of the model does not exceed 15%, which can provide reference for the daily operation and pricing decision of high-speed railway station media resources.
  • 图  1   高铁站媒体资源价值评估指标体系

    图  2   原始样本集特征数据箱线图

    图  3   年均媒体单价正态分布曲线对比

    图  4   特征数据初步筛选后的相关性热力图

    图  5   特征数量与RMSE关系折线图

    图  6   GBDT模型下特征重要性排序

    图  7   特征工程选择出的最佳数据特征

    表  1   调研高铁站媒体位置到达率和接触频次

    媒体位置触达率接触频次
    进站:进站大厅、进站口、进站通道、售票厅52.9%1.9
    候车区:候车大厅、检票口、候车区商层64.6%2.3
    出站:到达层、出站通道、出站口、出站大厅、地下通道52.9%1.9
    站台:站台、站台通道、站台楼梯52.9%1.9
    下载: 导出CSV

    表  2   部分特征数据项分布趋势衡量参数

    数据项平均数四分之一位数中位数四分之三位数标准差偏态系数峰态系数
    城市GDP10 505.15 865.007 201.9614 030.157 603.6531.441.97
    年经停列车数量30 736.314 812.021 597.033 139.7529 689.072.043.92
    坐席特征—商务座占比18.780.005.0121.0329.5562.084.01
    媒体面积20.498.0012.5624.0021.592.759.35
    年均媒体单价163 343.331 029.883 274.87202 919.71217 990.7042.9713.21
    下载: 导出CSV

    表  3   年均媒体单价为目标值的各种回归算法性能指标

    算法R2RMSEMAE
    线性回归(Linear Regression)0.45155023.78106836.75
    岭(Ridge)回归0.48150196.02105244.1
    梯度提升决策树(GBDT)回归0.59133708.5278106.63
    极限梯度提升(XGBoost)回归0.69116161.5363009.91
    随机森林(RandomForest)回归0.69116714.2868815.14
    下载: 导出CSV

    表  4   特征变换处理后算法库结果

    参数R2RMSEMAE
    n_estimators=99,max_depth=5,
    learning_rate=0.1,gamma=0.01
    0.80036376593696.9321254208.16506
    n_estimators=199,max_depth=10,
    learning_rate=0.01,gamma=0.03
    0.80386963192151.6385845317.47718
    n_estimators=129,max_depth=10,
    learning_rate=0.1,gamma=0.03
    0.80387242592150.3609445317.80572
    下载: 导出CSV

    表  5   2019~2021年度生产经营数据验证明细

    车站媒体位置媒体类型年度媒体面积/㎡价格/万预测值/万偏离度/%
    下载: 导出CSV
  • [1] 王雅婧. 中国高铁的领跑模式[N]. 中国纪检监察报, 2022-07-11(005).
    [2] 陈权超. 基于大数据的高速铁路客流分析[D]. 成都: 西南交通大学, 2020.
    [3] 肖启亚. 高铁媒体广告价值评估研究[D]. 南昌: 南昌大学, 2017.
    [4] 清水公一. 广告理论与战略[M]. 胡晓云, 朱 磊, 张 姮, 译. 13版. 北京: 北京大学出版社, 2005.
    [5] 孙文清. 广告效果的多级模糊综合评价 [J]. 企业经济,2006(8):89-91. DOI: 10.3969/j.issn.1006-5024.2006.08.029
    [6] 陈文恺. 我国高铁站内广告空间价值评估研究[D]. 北京: 北京交通大学, 2015.
    [7] 王 伟. 户外广告媒体价值评估方法研究[D]. 北京: 首都经济贸易大学, 2016.
    [8] 萨伯拉曼尼安. Python数据科学指南[M]. 方延风, 刘 丹, 译. 北京: 人民邮电出版社, 2016.
  • 期刊类型引用(20)

    1. 王震宇,武鹏,马露露,边原. 基于BIM参数化建模的接触网吊弦计算在京张高速铁路的应用研究. 铁道运输与经济. 2024(01): 67-73 . 百度学术
    2. 许建国,刘杰,孟祥奎,李育冰,王恒,王敬渊. 高速铁路接触网工程数字化安装关键技术. 电气化铁道. 2024(01): 8-12+21 . 百度学术
    3. 凌杰. 浅谈BIM技术在铁路接触网工程现场指导施工技术研究. 中国设备工程. 2023(08): 203-205 . 百度学术
    4. 张毅. 基于BIM的接触网腕臂装配设计系统研究. 铁路计算机应用. 2023(04): 38-42 . 本站查看
    5. 伊金浩,张毅,陈善乐,张鹏. 基于BIM技术的接触网三维数字化设计软件研究. 铁道标准设计. 2023(10): 171-178 . 百度学术
    6. 耿肖,石瑞霞,赵传. 参数化驱动的接触网腕臂装配BIM建模方法. 铁路技术创新. 2022(01): 98-103 . 百度学术
    7. 韩旻志,马强,董小兵. 基于三层架构的铁路信号BIM设计技术路线研究. 智能制造. 2022(05): 90-95 . 百度学术
    8. 韩旻志. 基于三层架构的铁路信号BIM设计技术路线研究. 铁道标准设计. 2021(01): 149-153+159 . 百度学术
    9. 邓梦. BIM技术在高速铁路接触网工程应用. 电子技术与软件工程. 2021(09): 193-194 . 百度学术
    10. 何利江. 智能化接触网腕臂预配技术研究及应用. 交通世界. 2021(18): 6-7 . 百度学术
    11. 梁崇亮,金光,乔锦新,李银生. 高速铁路接触网BIM设计研究与应用. 铁路技术创新. 2021(04): 32-36 . 百度学术
    12. 黄鑫,鲁小兵. BIM技术在400km/h高速铁路接触网工程中的应用. 高速铁路技术. 2021(05): 102-106 . 百度学术
    13. 靳辰琨,郭志光. 铁路四电工程建设BIM技术应用研究. 铁道标准设计. 2021(12): 110-115 . 百度学术
    14. 杨文成. 基于BIM设计的道岔设备建模方法研究. 铁道勘察. 2020(01): 133-136 . 百度学术
    15. 付逸群. BIM技术在南阳东站机电工程中的应用研究. 铁路计算机应用. 2020(02): 38-43 . 本站查看
    16. 范少杰. 高速铁路精密工程测量技术标准的研究与运用. 工程技术研究. 2020(06): 69-70 . 百度学术
    17. 吴积钦,杨佳,关金发,刘涛. 中国铁路接触网数字化发展策略与实践. 高速铁路技术. 2020(04): 21-27 . 百度学术
    18. 符跃忠. 既有高铁线路接触网双线腕臂支柱更换设计方案研究. 中国建设信息化. 2020(18): 58-59 . 百度学术
    19. 安蕾,杨斌,西穷. 基于BIM的京雄城际铁路接触网智能预配管理系统与应用. 铁道建筑技术. 2020(09): 30-34 . 百度学术
    20. 谈敦龙. BIM技术在高速铁路接触网工程中的应用研究. 智能城市. 2020(24): 109-110 . 百度学术

    其他类型引用(6)

图(7)  /  表(5)
计量
  • 文章访问数:  79
  • HTML全文浏览量:  37
  • PDF下载量:  22
  • 被引次数: 26
出版历程
  • 收稿日期:  2022-01-20
  • 刊出日期:  2022-12-24

目录

    /

    返回文章
    返回