近期股市大热,2024年9月30日,A股单日成交额超过2.6万亿并刷新纪录。而国庆后的第一个开盘日,10月8日则以3.4万亿的成交额再次刷新了这一纪录。海量交易为券商的IT系统也带来了极大的压力,多家证券公司出现了系统卡顿、登录失败、系统繁忙、行情界面加载异常等状况。作为知名券商,国泰君安的系统经受住了大并发的挑战,一直平稳运行,这与其长期以来的IT相关建设工作不无关系。
10月份,DOMM国标认证首批评估结果发布,国泰君安证券股份有限公司成为了首批通过三级认证的单位,也是首家通过该认证的金融机构。国泰君安证券信息技术部总经理助理陶惠勇对于参评经历总结了一句话:“查漏补缺,同时也是一个最佳实践。”
国泰君安的IT成长历程
“证券行业的科技能力,通常可以视为三个阶段,每个阶段约持续十年。”陶惠勇以国泰君安自身的发展历程举例进行了说明。“头一个十年,证券公司的IT力量非常有限,不管是开发,还是运维,依靠自身能力独自开展进行的工作很有限,各家公司只能有倾斜性的去保障一些重点业务与系统,许多业务系统以及外围系统主要依靠开发商以及第三方的能力。”陶惠勇表示这一阶段可以视作为主要依靠外部输入,产品同质化的现象非常明显。
而在第二阶段,一些领先的券商意识到同质化的服务提供不了差异化的竞争力,开始布局扩大自身的IT研发与保障能力。证券公司在这一阶段开始深度参与到包括核心交易系统的开发工作中,差异化逐渐体现。
你是否还记得过去开户需要去营业厅排队的画面?“早期的网上交易系统需要到线下开户,当技术与政策的大门打开后,线上开户的新型场景需求,对于开发商来说无法快速拿出相对成熟的产品方案给到有试点资格的券商。”陶惠勇对此举例道。因此,券商要更多的投入自身力量去与开发商进行业务的创新协作。相应的,系统运维与保障与第一阶段相比也产生了变化。“因为整个软件的研发与部署,需要开发商与券商共同完成,而不是以往仅依靠开发商。同时来自监管的要求,也使得券商需要配套自主运维能力,从而保障其稳定运行。”陶惠勇表示这些变化都使得券商的相应能力进行了同步提升。
移动互联网的爆发可谓是第三个阶段的标志性事件,其便捷性为证券行业带来了巨大增量。“坦率的说,在第一、第二阶段,券商的同质化非常明显,哪怕到现在我们仍然认为券商的同质化现象也是存在的。”陶惠勇如是说道。但努力突破同质化,构建差异化竞争力,包括用户体验、系统稳定性、业务敏捷性等,也是券商一直努力的方向,其自然要求券商提高IT研发、测试、运维、以及包括利用大数据与AI等相关能力。
“券商开始积极的引入以开源社区为代表的一些先进技术,如微服务、大数据、云原生等,将新技术都快速的引入自身的IT架构,从而应对来自系统并发、一致性、以及可靠性等方面的挑战。”据陶惠勇介绍,券商的主要系统已经从几十套,发展为数百套,相应的IT人员规模也是成比例增加。
业务规模复杂化,DevOps的作用尤为重要
随着业务规模的持续扩大、开源技术和微服务架构的不断引入、团队专业分工的细化,其整体复杂性与过往相比大幅度增加,在陶惠勇看来,引入DevOps的理念,特别是在标准与规范性方面就尤为重要。
“在移动互联网时代,一些客户已经不满足于‘给什么就用什么了’,客户会提出自己的要求,我们必须快速的进行反馈。”据陶惠勇介绍,这种来自新时代的挑战以过往的模式通常需要数以月计的工期来完成,而现在只需要1-2周。这对于客户体验带来的改变是非常直观的。当下,国泰君安的客户可以通过包括APP、社区、智能客服等多种途径进行反馈意见。通过各种技术的赋能,以往国内数百个分支机构的工作人员已经不仅能服务线下区域客户,更能通过相关工具快速响应线上客户的各类诉求。
“国泰君安一直在持续优化自身的工作流程,在过去我们也先后进行过多项认证来验证自身的工作,其中自然包括一些DevOps方面的认证。但是DOMM国标认证是第一个提出了组织级的DevOps成熟度模型,而这与国泰君安想要追寻的方向是一致的,因为局部的能力不代表组织,想要形成合力势必要进行组织级的梳理优化。”陶惠勇如是说道。
作为第一批“吃螃蟹”的人,国泰君安与翰纬科技合作,成立参评专项小组全力推进认证工作。在参评项目的选择上,没有选择相对独立、相对较小的项目,而是选择了重量级、组织级的移动端君弘项目和PC端重点项目进行评选申报,具有典型性和代表性,能够更真实的反应公司在不同业务场景下的开发运维能力水平。在这个评估认证过程中,IT线16个小组,四十多名员工参与其中,这是国泰君安IT条线参与规模最大、覆盖规模最多的一次评估之一。
“在这个过程中,与翰纬科技的顾问老师一起基于DOMM国标定义的6大能力域的200多条能力要求进行审查,包含现有的开发流程、运维体系、团队协作模式、工具使用情况等,找出与国标要求的差距和自身的优势,根据自我评估的结果,制定针对性的改进计划。在认证过程中,我们实现了更多自动化工具的集成应用,比如落地接入代码和制品扫描工具、完善自动化测试流程等,帮助我们促进了工具应用和标准落地。”在回顾这一持续三个多月的过程中,陶惠勇表示重新认识到了流程实践过程中的一些问题与不足,明确组织建设和改进的方向,为后续的创新实践打下了坚实的基础。
DOMM认证到收获
国泰君安在过去的两三年中持续的开展了在流程、组织以及平台工程等方面的优化工作。对此,陶惠勇举例道:“比如在流水线上,以前只有个别的团队利用开源工具在做持续的CI/CD工作,这种效能的提升只局限于单一团队或者说是单个系统;而现在通过公司级的流水线,上百个系统都可以得到提升。这种组织级的提升,相比过往局部的提升其带来的影响是完全不同的。我们要通过从流水线以及工作流的梳理,让其变得透明数字化,尽量推动其在整个工程链条上铺开。”
虽然大家一直在讲DevOps,但许多时候的惯性思维使我们不能跳出如“开发测试阶段跟运维关系不大;安全团队总是后知后觉的去找开发团队、应用团队、数据团队进行整改”等现象。“如果从全局上来来看,无论是安全还是质量,难道不应该是贯穿始终吗?我们需要让大家逐步的去建立这样的思维,并且通过工作流让这些要素贯穿产品的整个生命周期,立项到架构、设计、研发、测试等过程,使之成为一个整体。我们正朝向这个目标持续努力,这也是通过此次认证过程对我们非常有价值的输入,以往我们可能只是有一些概念,并进行了局部探索,但是在体系化标准化的指导下还有很大优化空间。”陶惠勇如是说道。
陶惠勇在访谈的最后总结道:“有一些效能上的提升是可以量化的,但是还有一些收获是无法用数字衡量的。一些重要的方法论,包括对于资产管理、风险管理、以及创新的技术实践的积累,对于整个企业也是非常重要的。”