8月18日-19日,2023中国算力(基础设施)大会在宁夏银川举办。本届大会以“算领新产业潮流 力赋高质量发展”为主题,聚焦算力前沿技术领域,展示算力融合应用成果,推动算力产业加速发展。
智慧时代,计算力就是生产力。算力已经像水、电一样,渗透到生产生活的各个领域,正以一种新的生产力形式,为各行各业的数字化转型注入新动能,成为经济社会高质量发展的重要驱动力,其发展快慢、好坏与否将直接影响数字经济的发展质效。
近年来,我国算力产业规模快速增长,梯次优化的算力供给体系初步构建,有力支撑了数字经济的快速发展。《2022-2023全球计算力指数评估报告》显示,2022年中国整体服务器市场规模仍然保持6.9%的正增长,出货量为376.8万台,销售额达270亿美元,占全球市场25%,仅次于美国稳居第二。在计算力作用下,生产力得到前所未有的释放,算力在拓展经济发展新空间、促进经济总量持续增长方面的价值凸显无疑。计算力指数平均每提高1点, ,国家的数字经济和GDP将分别增长3.6‰和1.7‰,算力资本可与传统资本形成互补和协同效应,一个国家或地区增加对算力相关的投资可以带来经济增长,且这种增长具有长期性。
释放算力多元化价值,融合架构是关键,一云多芯是抓手
数字化、智能化时代,算力在生产组织、科技创新、社会治理、民生改善等领域正发挥越来越重要的作用,但是随着数字技术与物理世界的的融合更紧密,真实生产环境的计算场景变得越来越多样,计算架构也越来越复杂,如科学研究对计算精度要求极高,需要高性能、强逻辑性的算力;人工智能对计算精度的要求相对较低,但对并行计算性能有更高要求;大数据需要近数据计算,对存算一体化的需求更强烈,多元化已经成为算力发展的重要趋势。
但是,算力多元化在实际落地中面临技术、生态和业务等方面的多重挑战。从技术角度来看,需要解决不同计算资源互联互通的问题,实现多元算力高效整合、灵活弹性,让算力真正像水、电一样随需随用;从生态角度来看,需要解决芯片产业生态离散化、标准缺失的困局,打通从芯片到算力的“最后一公里”,通过算力标准化实现高质量算力服务;从业务角度来看,防范供应链风险需要增加算力供给来源,但如何化解多元算力整合乃至融合所带来的系统风险,确保业务连续性是重中之重。
浪潮云海首席科学家张东认为,释放多元算力价值,应该从“以应用为导向,以系统为中心”的全局思维出发,大力发展场景驱动的“硬件重构+软件定义”的融合架构,通过软硬高度协同优化,实现多元算力的高效融合与场景定义,促进各类数字业务创新,推动数字经济高质量发展。
目前,浪潮信息在融合架构研制上已取得突破性进展,最新发布的融合架构3.0原型系统,以开创性的系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,支持池化资源异步升级、支持细粒度多主机共享高并发存储、亚微秒级远端内存共享访问等特性,可通过软件定义实现“一套系统,N类应用”,加速云、数、智、边、端等多数字技术融合。
而作为融合架构软件定义系统的核心,浪潮信息在云操作系统上完成了“一云多芯”多项关键技术突破,可实现通用算力、异构算力、专用算力等计算资源以及存储、网络资源的统一池化,通过架构自适应感知调度实现算力高度自动化分配以及负载调度。目前,云海操作系统(云海OS)完成了业界首个面向一云多芯场景的SPEC Cloud基准测试,在三种处理器节点混合部署集群测试中,相对可扩展性、平均实例配置时间等指标均达到全球领先水平,验证了云海OS在业务应用跨处理器架构场景下的高效率、高性能和高扩展能力。
张东表示,“一云多芯将成为IT产业链承上启下的关键环节,纳管适配底层各种芯片、操作系统,兼容承载各种类型的虚拟机、容器、数据库、中间件,支撑运行各类云原生应用和软件,是未来云计算平台的核心能力之一,其不仅是芯与云的融合,更是平台+生态的协同。”
三大理念持续引领一云多芯发展
一云多芯通常是指一种一体化管理的云计算架构,利用一套云操作系统来管理不同类型的芯片、架构、接口、技术栈等硬件服务集群,将硬件封装成标准算力,给客户提供体验一致的云计算服务。一云多芯的最终目标是支撑用户业务在不同架构处理器之间的低成本切换或者自由切换。为此,浪潮信息倡导“应用导向、以系统为中心”、“分层解耦、开放标准”、“迭代创新、持续演进”的一云多芯发展理念,推动一云多芯持续创新与普及应用。
在设计侧,浪潮信息以应用为导向,以系统为中心,实现场景驱动的软硬件协同设计,涵盖应用、系统、硬件设计等等。
在技术侧,浪潮信息强调资源层、平台层和应用层的“分层解耦”,从而实现架构无关的各层独立可扩展。同时,坚持开放技术路线,通过标准化协议、API、服务,实现资源的互兼容、互操作。
在产品侧,浪潮信息以“有-好-优”三步走来实现一云多芯产品的持续演进与生态繁荣。第一阶段,实现混合部署、统一管理、统一视图,解决“有”的问题;第二阶段,实现业务牵引、分层解耦、架构升级,解决“好”的问题;第三阶段,实现算力标准、全栈多芯、生态共建,解决“优”的问题。
张东表示,当前一云多芯的发展正从第一个阶段迈向第二阶段,第二阶段、第三阶段还处于探索期。在当前产业链重构的大背景下,推动一云多芯技术理念,并不是简单的进行产品化的落地,而是需要芯片厂商、整机厂商、云服务商以及应用端的用户都切实理解并实践这一理念,最后形成行业认可的生态标准,共同达成一云多芯这一终极目标。(柯岩)