随着信息化建设的推进,铁路行业围绕信息化运维已经进行了卓有成效的建设,通过多种运维系统分别对IT环境中的网络、主机、业务应用等进行管理。但各运维系统未能有效整合各运维系统,无法提供高质量的运维服务,无法满足高质量运营要求。具体如下:1.运维衔接不畅:各监控、管理、分析应用形成了数据孤岛,功能、数据之间无法联动。2.缺乏自动化智能化手段:运维效率较低,缺乏有效的自动化运维手段,智能化分析仍有很大的提升空间。3.运营能力有所欠缺:现有服务交付速度还不能满足业务要求,整个信息系统的能耗工作还缺乏科学指导手段,整体还是成本中心,不能体现全部效益。
解决方案
智能运营服务平台,实现基础设施和应用业务的高效运行管理,纵向实现路局、电算站、站段多级机构的有效互联互通,整体管控,横向支持业务的协同保障,全网统一运维。具体包括:1.提供一体化管理服务,实现多个权限隔离的用户的独立运维,将现有各个分散的运维系统孤立的数据整合到一个数据平台,实现数据的统一的接入、管理和消费。在数据统一的基础上实现服务统一,包括各个系统的单点登录、集中告警等服务。2.提供自动智能化管理服务,突出预防性维护的重要作用,其核心价值在于提前预测异常,早期介入,规避风险。通过对历史数据的学习,根据具体问题建立趋势分析、异常波动等预警模型,在实时数据与模型特征发生偏差时,提前预测故障,提高系统可靠性。3.提供运营化管理服务,增强用户体验,提高运维效率,细化运营收益,结合运维平台智能化运维、管理场景自动化等多项服务功能,通过对运营过程的改善,实现运营效益的提升,提升各运维环节的执行效率,加快服务交付速度,推动节能降耗,提升资源效益,细化运营推广的边界和各项成本,有利推动运维部门从成本中心向效益中心转型。
实施内容
1.基于中台技术构建运维支撑平台平台提供采控中台,实现对IT基础设施、软件等的统一的数据采集和操作。平台提供数据中台,针对运维数据的汇总、分析处理和数据消费服务。平台提供AI中台,提供数据获取、训练、标注、特征工程、自主训练、模型追踪、算力支持、在线更新等服务。平台具备多租户能力,能够按不同租户提供独立服务,包括用户管理、资源管理、数据共享、服务提供等。2.自动化微应用内容自动化微应用,使用灵活度较高,能够解决基础软件产品的固化功能无法快速解决的问题,满足用户的定制化需求。该模块并没有因为高度灵活而具有较高的使用门槛,反而因为自然语言编程,能让用户快速上手。3.智能运维微应用依据先进的人工智能架构,对各类IT设备数据进行建模,支持设备早期异常预测、故障问题定位和辅助处理、疑难故障事后关联分析、云资源智能化调度等多种应用场景。通过智能化提供的全新技术手段,完善铁路行业用户日常运维工作中的急需内容,实现了运维手段质的飞跃。4.知识分享微应用提供了知识发布、知识检索与浏览、知识提问、知识回答、个人知识管理、知识的范围与系统融合应用等功能,能够更大限度地快速协助个人用户获取自己想要的知识。知识范围涵盖包括监控、故障处置、经验知识在内的众多知识领域,能有效帮助企业沉淀基础监控实现内容。5.基础监控微应用在满足用户对于数据中心各类设备基本状态和性能、无人值守及实时展示的基本运维需求的同时,智能抓取关键性能数据,根据预置策略进行数据分析和联动处置。6.配置管理实现内容配置管理有效解决了各信息系统独立建设,各自维护一套自身业务相关的配置数据库,缺乏自上而下的整体规划的问题,解决各信息系统数据分散、来源混杂问题。7.服务管理实现内容服务管理模块紧密集成,协同作业,结合流程、人员和技术三要素,完整支持“以流程为导向,以客户为中心,生命周期管理”的IT服务管理目标。
实施效果
1.一体化效果统一管理:提供统一租户管理,提供基础设施和应用业务统一管理。统一协作:支持多机构的统一服务和协作。统一分析:综合基础设施和应用业务的各配置、性能、工单、告警数据统一分析决策。统一展现:支持展现自有数据和融合数据,让核心指标一览无遗,帮助用户关注核心重要问题。2.智能化效果数据全面:基础模块提供完整性能、配置、关系、工单、知识、任务数据,并支持融合外部数据。诊断高效:大数据图形化智能诊断,多种诊断方式共同保证高效诊断。定位精准:通过自动化场景提供辅助排查,为智能化分析提供验证和排查手段。结果直观:智能化分析结果的图形化展现,直观易懂。3.运营化效果租户管理:提供租户的管理模式,按业务实际情况,可对外提供以租户为单位的运维服务。部署简单:面向各租户提供监控、配置、流程、智能服务,一键部署,操作简单。分享生态:支持在租户间分享多种运维经验、知识、场景、应用,共建运营分享生态。体现价值:体现运营成果与价值,并让运维的成果为更多人员创造价值。
作者:章继刚