Application of cloud infrastructure resource technology in railway industry
-
摘要:
针对铁路行业数字化转型中,传统信息系统架构在基础资源管理方面效率低、扩展性不足、运营维护成本高、难以快速响应业务需求变化等问题,提出铁路行业云基础资源技术架构,以及针对网络资源、计算资源、存储资源的配置策略和技术应用方案;针对不同应用类型,设计上云方案,满足铁路业务系统对基础资源的灵活配置需求,保障基础资源的稳定和安全,为基础设施资源共享提供支撑。
Abstract:In response to the problems of low efficiency, insufficient scalability, high operation and maintenance costs, and difficulty in quickly responding to business demand changes in the digital transformation of the railway industry, this paper proposed a cloud infrastructure resource technology architecture for the railway industry, as well as configuration strategies and technical application solutions for network resources, computing resources, and storage resources, designed he solutions for migrating to the cloud for different application types to meet the flexible configuration requirements of railway business systems for basic resources, ensure the stability and security of basic resources, and provide technology support for infrastructure resource sharing.
-
行业云作为数字经济发展的重要基础,已在能源、交通、金融等领域广泛应用。各行业建设的行业云具有如下特点。
(1)分布式架构,统一管理:以多云架构或混合云架构实现分布式多地多中心数据中心资源的统一管理。
(2)全栈服务,跨层融合:行业云注重全栈服务整体供给,强调能力跨层融合优化。
(3)云边协同,综合施效:边缘云统一规划建设、分布式使用,通过云边协同技术对边缘节点进行统一管理。
(4)场景化服务,助力转型:行业云提供了沉淀场景化服务的能力,支撑业务模型积累,形成行业知识库,推动企业数字化转型。
铁路行业高度重视行业云的建设,中国国家铁路集团有限公司(简称:国铁集团)发布的《“十四五”铁路网络安全和信息化规划》指出,要推进云边结合的铁路行业云数据中心建设,优化业务应用总体布局[1]。因此,亟需构建铁路行业云,形成国铁集团信息化发展和数字化转型的坚实底座[2]。
铁路行业云的资源需求包括计算、存储、网络、安全等信息基础设施资源[3]。铁路行业云需要实现对各项资源的集中部署和跨地域管理,通过云平台统一管理物理资源池和虚拟资源池,对不同等级的资源池分区建设,实现资源的充分共享、合理调度及动态调整[4]。
本文提出铁路行业云平台基础资源技术架构及针对网络资源、计算资源、存储资源的配置策略和技术应用方案,将传统信息系统的“刚性”基础设施转变为“弹性”资源,为铁路数字化转型提供支撑。
1 铁路行业云基础资源技术架构
铁路行业云基础资源技术架构如图1所示。
1.1 物理层
该层是云计算服务的物质基础,通过数据中心、服务器、存储设备、网络设备等硬件资源,提供数据存储、计算能力、网络连接、能源供应、冷却系统、安全保护、灾难恢复、可扩展性和维护管理等功能,确保云计算服务的稳定性、安全性和可靠性。
1.2 虚拟化层
通过软件定义网络(SDN,Software-Defined Networking)、软件定义计算(SDC,Software-Defined Compute)和软件定义存储(SDS,Software-Defined Storage)技术,实现网络、计算和存储资源的灵活管理、自动化配置和高效利用。这些技术共同支撑资源池的构建和管理,即虚拟数据中心(VDC,Virtual DataCenter)[5],支持由策略驱动的配置和管理自动化,从而提高资源交付效率。
1.3 服务层
通过基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等3种服务模式[6],为用户提供了从底层硬件资源到应用程序的全方位服务。这些服务通过抽象化和自动化技术,将复杂的底层基础设施管理与应用开发流程标准化,简化用户的操作,提高资源利用效率。
1.4 消费层
作为用户与云服务交互的接口,提供直观易用的界面和应用程序编程接口(API,Application Programming Interface),使得用户能够轻松获取、配置和管理云资源[7],主要可通过DevOps环境和终端环境,简化云计算服务的消费过程,支持从个人开发者到大型企业的不同需求。
1.5 资源策略
将离散的硬件资源转化为可编程、可预测的服务能力,可分为静态策略和动态策略。静态策略适用于稳定性较高的任务;而动态策略能够适应不断变化的负载情况。资源调度技术多采用负载均衡、弹性伸缩等,调度模型框架如OpenStack的Swift、Hadoop的YARN,以及Docker Swarm等,提供资源管理、任务调度、监控与诊断等功能。资源调度任务括云服务调度、作业任务调度和数据调度,旨在提高资源利用率、系统性能和任务响应速度。
2 铁路行业云基础资源技术应用方案
铁路行业云基础资源主要包括网络资源、计算资源及存储资源。
2.1 网络资源
2.1.1 网络资源配置策略
国铁集团(本级)数据中心及各铁路局集团公司应用运行中心承载的业务复杂多样,其云平台网络架构也应根据业务特点和需求而有所不同。云平台网络主要基于软件定义技术所构建的Overlay网络,支持跨资源池、跨数据中心的资源的分配使用;支持双活或灾备资源跨数据中心的调度迁移;支持虚拟机和容器在数据中心内不同资源池间的调度迁移和安全策略跟随。同时,保证整个计算资源池东西向与南北向带宽充足,以满足业务应用灵活部署、按需扩展、高效运行等基本需求。
2.1.2 网络资源技术应用方案
根据网络技术的不同,云平台网络资源可分为物理Underlay网络、软件Overlay网络和硬件Overlay网络。目前,业界主流Overlay技术一般采用VxLAN协议。网络资源技术应用方案如图2所示。
(1)使用物理设备及链路构建物理Underlay网络。物理Underlay网络使用传统VLAN、二层报文交换、三层路由转发等技术,同物理设备具有紧密的耦合关系,本身不具备云化、虚拟化能力,资源自动化编排能力较差,主要用于云平台所有设备的物理层连接,以及各类专线、广域网物理通道的连接,是软件Overlay网络、硬件Overlay网络的底层载体,并负责生产区、开发测试区、运维管理区之间的跨区数据交换。
(2)基于软件Overlay网络承载所有云平台虚拟化网络。基于软件Overlay的网络组网方案,整体思想是将VxLAN封装工作交由虚拟交换机执行,通过虚拟交换机对 VTEP 进行封装,而 Underlay 网络的三层网关一般部署在距离服务器最近的交换机上。铁路行业云内部,东西向防火墙等主要以分布式软件的形式部署在服务器之中;负载均衡同样可采用软件方式来实现;针对南北向流量的防护,则可借助软件或硬件防火墙达成;云管理服务通过驱动 SDN 的途径,实现对网络及相关服务的统一部署。软件Overlay的方式虽然消耗了一部分物理Underlay网络和计算设备的性能,但使业务网段得到更大规模的扩展,赋予网络资源更灵活、智能的服务能力。
基于软件Overlay网络方案的网络流量,可以分为4类:①租户内部同子网流量,同一租户同子网流量,属于同一个VxLAN L2广播域,直接二层转发;②租户内部跨子网流量,同一租户跨子网流量,属于不同VxLAN L2广播域,经过分布式逻辑网关转发;③跨租户流量,属于跨子网转发且存在安全隔离需求,因此需要采用虚拟或物理南北向防火墙转发;④外部用户访问某租户服务器,一般要经过IDS/IPS、FW、LB、网关等节点再到租户服务器。
(3)使用硬件Overlay网络作为软件Overlay网络的补充,承载软件Overlay网络无法直接连接的物理资源。基于硬件Overlay的网络组网方案,一般采用专有网络设备硬件与专有的SDN控制器,将VxLAN封装工作交由Leaf(叶节点)交换机完成;Leaf交换机直接连接各服务器,负责服务器与网络设备间数据的VxLAN封装解封装,Spine交换机连接所有Leaf交换机,组成一个巨大的数据交换矩阵,使不同Leaf交换机的VxLAN报文得以互联互通;Leaf交换机、Spine交换机之间运行三层路由协议,通过三层路由协议打通物理Underlay网络;VxLAN网络运行在物理Underlay网络之上,控制层面采用标准IP层协议即可;这种方式采用专有的硬件SDN控制器来配合云管理服务进行网络配置自动化,灵活度、智能水平弱于软件Overlay网络,但可以很好解决硬件负载均衡设备、物理服务器等的网络连接需求,并与软件Overlay网络实现联动。
2.2 计算资源
2.2.1 计算资源策略
计算资源包括虚拟机、容器和裸金属资源等,为便于资源管理,不同类型的计算资源按照分区的方式分别建设。管理员可为用户分配虚拟机资源、容器资源等。用户在申请虚拟机资源时,云平台将自动安装好用户选择的操作系统并完成启动。可将虚拟机定义成服务目录供用户申请使用,用户根据需求选择镜像类型、资源规格及网络,自动完成服务器的操作系统安装和网络配置。用户申请容器等资源时,也是类似流程。云数据中心的计算资源,应对虚拟机、容器等进行统一管理,再根据业务需求,进行资源调度。
2.2.2 计算资源技术应用方案
基于计算资源硬件,按分区原则构建虚拟机、容器、裸金属计算资源池等,构建计算资源技术方案如图3所示。
在铁路业务系统向云计算环境迁移过程中,可按照业务应用需求选择不同规格类型资源池的资源。资源规格需要根据各系统对于CPU、内存、网络和存储的I/O等需求进行分类。资源的申请应符合铁路资源的管理规定;资源的分配和维护应支持智能调度;对资源的使用应支持监控和告警,支持按照资源的使用情况动态迁移、扩容或回收资源。
2.3 存储资源
2.3.1 存储资源配置策略
随着铁路业务系统数据量的快速增长,需要以合理的成本实现高效的数据存储和管理,并且能够适应铁路业务的云化发展。可按照应用场景或技术类型建设不同的存储资源池。云平台以自助式的服务目录按需分配存储资源,自动化的执行操作,为用户提供块、文件、对象等存储服务,以及备份、恢复、快照、复制、迁移等数据服务,让用户获得随时申请、即刻获得的便捷服务。
分布式存储软件控制节点冗余配置,数据节点采用多副本策略,副本数据分布在不同机柜、不同服务器上,保证数据安全。
2.3.2 存储资源技术应用方案
存储资源池的技术应用方案如图4所示。
通过构建集中式存储,可以有效整合企业内部的业务资源,使得各种业务平台、业务系统、主机系统共用一个存储空间,而空间的分配对于各个业务系统是透明的,每个业务系统都可随时调整、动态改变自身空间。
集中式存储网络包括NAS、IP-SAN、 FC-SAN和RoCE-SAN等4种不同组网方式[8]。存储设备和服务器之间通过高速网络连接,实现存储资源共享、数据备份和容灾。存储资源池可以根据承载业务或服务器操作系统的不同类型划分为多个不同等级的存储区。
分布式存储(ServerSAN)系统可将集群内各存储节点的HDD、SSD等存储介质,通过分布式技术组织成大规模存储资源池,为上层应用和客户端提供业界标准接口,消除传统数据中心因多类型存储系统烟囱式构建而导致的硬件资源利用不均等问题,实现按需提供块、文件和对象全融合存储服务能力。
目前铁路各级数据中心中使用的大多数存储设备都是基于FC-SAN的集中式存储,兼顾现状并考虑未来发展,在铁路行业云平台的存储设备选型方面,建议根据实际情况采用集中式存储与分布式存储相结合的方案。
3 业务系统上云方案
针对不同的业务系统,提供基于虚拟机、云服务、微服务部署的应用上云模式。
(1)基于虚拟机的应用上云方式,是将单体架构、分布式架构业务系统(全部或部分)迁移或部署到IaaS上,使用虚拟机、块存储、网络等资源,不涉及到应用、操作系统、数据库等变更。在原有软件架构保持不变的前提下,还可进一步优化:使用云平台弹性负载均衡服务;应用无状态化改造,将状态数据缓存到独立的状态服务器,实现应用服务器的无状态化;配置弹性伸缩组,实现应用服务器的弹性伸缩;使用云提供的安全服务;选择云主机、云硬盘备份服务等。
(2)基于云服务的应用上云方式,是在单体架构、分布式架构业务系统(全部或部分)迁移或重新部署到云时,使用已有云服务能力,如数据库、中间件等。使用数据库、中间件等需要考虑类型、功能、规格、部署模式的满足性,主要涉及配置调整和数据库迁移。应用在上云时应做相应的云化改造,以复用云能力。在选择云服务时,可根据业务要求,从如下方面进一步优化方案:数据库采用集群模式部署并选择备份服务;使用云平台弹性负载均衡、云安全服务、云弹性文件服务、对象存储服务;选择云主机、云硬盘备份服务等。
(3)基于微服务的应用上云方式,是在微服务架构业务系统迁移或部署到云时,使用已有云服务能力,如微服务平台、应用运营维护(简称:运维)管理、服务网格、应用性能管理、应用集成服务、软件开发服务DevOps、容器引擎、数据库、中间件等。基于微服务架构开发和部署,应在方案设计时考虑微服务与IaaS的深度融合,包括多层次高可用的资源调度机制设计、容器引擎与IaaS在网络及存储的整合、统一监控及运维、统一安全防护。
4 结束语
本文设计的基础设施资源技术应用方案已在中国铁路主数据中心二期采用,并在中国铁路运输调度指挥平台、铁路货运生产作业与管控平台、财务共享服务管理信息系统等开展应用。
本文研究铁路行业云基础资源技术,提出了基于IaaS、PaaS和SaaS这3种服务模式下,计算、存储、网络等基础资源的应用方案与配置策略,能够有效提升铁路行业信息系统的资源整合效率和运行稳定性,为铁路业务的数字化转型提供有力支撑。未来,将继续聚焦于云计算技术与铁路业务的深度融合,持续优化技术方案,加强技术创新与研发投入,以适应云计算技术的快速发展与市场需求的变化。同时,加强安全体系构建、自动化运维与监控、资源弹性扩展及成本优化方面的研究,推动铁路行业云的建设与发展。
-
[1] 郑 晨,苏 凡. 国铁集团印发《“十四五”铁路网络安全和信息化规划》[N]. 人民铁道,2022-05-12. [2] 唐 涛,田谨源,朱 力,等. 基于OpenStack的城市轨道交通高可用私有云平台研究[J]. 中国安全科学学报,2022,32(06):137-143. [3] 施卫忠. 铁路数据中心建设与规划研究[J]. 中国铁路,2021(1):1-7. [4] 向 晟. 铁路多地多中心云资源管理及关键技术研究[J]. 中国铁路,2024(1):148-153. [5] 毛 良,向光晖,王 涛. 基于软件定义数据中心(SDDC)架构的桌面云设计和应用[J]. 中国高新科技,2020(23):126-129. DOI: 10.3969/j.issn.2096-4137.2020.23.060 [6] 潘红芹,高 洋,安婷玉,等. 铁路信创云平台解决方案[J]. 中国铁路,2024(3):71-77. [7] 李 博. 云计算在铁路信息化基础设施建设中应用研究[J]. 铁路计算机应用,2015,24(10):1-5. DOI: 10.3969/j.issn.1005-8451.2015.10.001 [8] 孔 兵. 基于RoCE网络的集中存储及AI算力集群建设项目[R]. 北京:中国工商银行股份有限公司,2023.