一、背景:业务增长迅速,运维管理遭遇新难题
广发银行,作为是国内最早组建的股份制商业银行之一,紧跟信息技术的飞速发展和数字化转型的浪潮,积极采纳云计算技术前沿成果,依托阿里飞天云平台构建了其“行业云”体系,以支撑日益增长的业务需求。随着行业应用的不断上云与云平台内部运维工作的不断深化,运维管理工作的复杂性与挑战性不断上升。运维团队在享受云计算带来的灵活性与高效性的同时,也面临着诸多挑战:
1、运维手段方面,手工与脚本为主的运维模式,响应效率待提升
运维团队主要依赖于手工操作和部分脚本进行资源管理,这种管理模式依赖于运维人员的熟练度和经验积累,响应效率受限。
2、运维工具方面,自动化能力有待加强,监控范围须实现全覆盖
资源配置和变更管理自动化能力不足,需要能够自动发现、采集和统一管理配置的运维工具;云平台之上的操作系统、中间件等关键对象的监控须实现全面覆盖。
3、流程方面,线下流程为主,亟需流程管理工具支撑
运维流程依赖线下操作,效率无法匹配新的需求,其流程难以追溯,需要一个统一的流程平台来管理运维活动。
二、解决方案:构建高效智能的运维监控平台
1、打造运维一体化平台,打通系统壁垒
广发行业云项目通过引进嘉为蓝鲸一体化自动化运维平台,实现对传统运维模式的革新。该平台具备PaaS化和集成化能力,能够实现对运维对象的集中纳管、运维权限的统一管理、运维数据的联动共享。平台具备高度的灵活性和可扩展性,能够快速适配多种运维场景,为运维团队提供低成本、高效率的技术支持。同时,该平台融合了飞天云的功能,能够在运维监控、管理、控制等业务域持续扩展,以其全面的功能覆盖、高灵活性与可扩展性,为企业的数字化转型提供的坚实的运维保障,提升了运维的效率和智能化水平。
2、建设基础运维工具能力
在广发行业云项目构建一体化自动化运维平台的过程中,着重建设三大核心运维管理模块:配置管理中心(CMDB)、监控中心、IT服务管理中心(ITSM)。
配置管理中心:建设统一的配置管理中心,实现资源的统一管理、配置、维护及自动化发现,支持关系建模与版本控制,确保运维数据准确性。
监控中心:建设监控中心,集成多种主流监控工具,通过统一平台实时监控系统性能、安全、日志等多维度信息,支持告警事件的统一管理、去重与聚合,提升了故障响应与处理能力。
IT服务管理中心:建设IT服务管理中心,规范了IT服务管理流程,涵盖服务请求、事件、问题、变更管理,与告警中心紧密集成,实现告警与工单自动关联流转,提升了IT服务标准化与流程化水平。
三大模块协同工作,为广发云项目提供一体化、自动化的运维保障。
3、赋能运维团队
广发行业云项目在构建一体化自动化运维平台的过程中,通过推动运维团队向运维开发、运维分析、运维操作、运维专家四位一体的协作模式转型,实现运维服务的持续优化与创新。此过程将运维管理经验和知识深度沉淀于平台,通过自动化运维场景的建设与扩展,极大提升了运维工作的标准化和规范化。同时,平台具备强大的自主扩展能力,赋能运维团队根据业务需求快速构建和扩展自动化运维场景,确保运维工作的灵活性与高效响应,从而全面赋能运维团队,提升整体运维效能。
4、保留未来建设一体化空间
项目在规划之初就重新考虑了未来的可扩展性和兼容性。通过采用模块化、标准化的设计思路和技术架构,为未来的研发、运维、运营一体化建设预留了充足的空间。随着技术的不断进步,广发行业云的运维体系能够灵活应对新的运维挑战。
三、项目成果
1、构建运维PaaS平台,具备一体化运维能力
构建具备一体化能力的PaaS平台,实现对运维对象的集中纳管;高效管理各类运维资源,确保运维权限的统一分配与管理;支持运维数据的联动共享,提升运维团队的工作效率和响应速度。
2、建设统一配置管理(CMDB)系统,为运维打造坚实数据基础
以应用为中心建立统一配置管理系统,纳管基础设施维护范围内的所有软硬件资源并进行批量录入工作,提高管理效率;构建消费数据能力,实现数据可管可控、信息可用性提升以及资源可视化管理,为企业决策提供有力的数据支持。
场景价值:纳管包括主机、数据库、组织架构、应用、网络、中间件等多种类型的资源,实现资源的统一管理。
3、打造统一监控平台,夯实观测基础
打造统一监控平台,构建监控能力,对基础资源全面监控,支持监控采集自定义设置,满足不同业务场景需求;通过业务资源全概览功能,了解业务系统的运行状态;监控体系具备良好兼容性,无缝对接各类云平台,为企业混合云管理提供便利。
场景价值:打造统一运维监控大屏,实现对工单、安全攻击、安全告警等相关信息的监控,提升了运维管理的效率与安全性,确保业务运行的平稳与连续。
4、打造行业云IT服务管理系统,实现流程管理标准化、统一化
建设IT服务管理(ITSM)系统,包括行业云变更流程、行业应用变更流程、紧急变更流程以及资源申请流程;支持流程规范,具有灵活性、可扩展性和高性能,满足个性化需求;流程贯穿监管控各个环节,云运维数据、自动化运维融合,打破运维孤岛现象,实现运维工作全流程闭环管理。
场景价值:上线了行业云变更流程、行业运用变更流程、紧急变更流程以及自愿申请流程4个流程,实现了IT服务管理的标准化、统一化。如资源申请流程,提单人通过提单发出申请,获得审批后运维人员实施任务,实现资源交付流程统一化,提高了服务效率。
四、总结
广发银行行业云携手嘉为蓝鲸,从构建一体化平台出发,不仅实现了运维监控的全面整合与优化,更在推动行业云运维向数字化、智能化转型的方面树立了新的里程碑。随着项目的深入建设,将构建起一套高效、智能、稳定的IT运维体系,这不仅为业务运营的连续性、安全性和稳定性奠定了坚实的基础,还有效支撑广发银行行业云当前业务的蓬勃发展,更为其未来在金融科技领域的持续创新和跨越式发展注入了源源不断的动力。广发银行行业云与嘉为蓝鲸的合作将持续深化,共同开启运维管理的新篇章,赋能银行业务数字化转型,迈向更加智能、高效的发展道路。