联想孙伟:海神液冷服务器为AI数据中心进行绿色赋能

来源:咸宁新闻网
2024-03-01 16:49:28
分享

近年来,“人工智能”、“ChatGPT”、“模型训练数据中心”等概念备受关注,成为服务器行业的热门话题。随着服务器算力的不断提升,CPU、GPU、AI处理器的功耗也随之增加。为了充分发挥各种处理器的性能,散热效率需更上一层楼。随着算力的激增,数据中心单机功率密度不断提升,能耗也随之攀升。传统的风冷系统已无法满足不断增长的低碳散热需求,因此液冷技术的重要性日益凸显。AI服务器的高算力密度使得液冷技术成为了一种既具有性价比又高效的温控手段。据预测,到2025年,我国液冷数据中心市场规模将突破1200亿元,行业增速将保持在30%以上。

我们有幸采访到了联想(深圳)计算机科技有限公司服务器专家孙伟,跟她一起畅聊了关于液冷服务器的技术发展历程、技术细节、技术优势、创新产品和实施案例等多个方向,分享了联想在液冷服务器方面的最新进展。

孙伟专家首先给我们介绍了液冷服务器的技术发展历程:随着计算力的不断增加,带来了能耗居高不下,很多传统数据中心的PUE到达了1.9或更高,造成了能源的浪费,因此,我们需要数据中心向低碳、绿色方向演进,最重要的一环就是可以采用更加绿色低碳的IT产品部署数据中心,从而加速实现“双碳”目标。孙伟表示,液冷是数据中心实现低碳、降低PUE最直接的一个手段。液体比传统空气冷却有两个指标优势明显:液冷比传统风冷效率高25倍;液冷在单位时间内能够带走的热量是空气冷却的3000倍。联想集团是数据中心行业的领军企业,早在2012年就推出了温水液冷技术。通过不断的优化和升级,联想最新一代海神温水液冷技术的PUE(能源使用效率)可降至1.1左右,实现了42%的节能减排。据披露,联想高性能计算已在全球范围内部署了超过10万个温水液冷节点,并在高性能计算系统技术方面申请了85项国家发明专利,其中46项已获授权。

据孙老师介绍,液冷技术是联想在全球范围内竞争力最强的解决方案之一。在中国国内,已经有大规模采用液冷技术的数据中心,并且在欧洲也有许多成熟的应用案例。中国政府、大型企业以及对能源效率要求较高的机构,对液冷技术的关注度不断提高。联想在这方面拥有非常成熟的解决方案,涵盖了服务器及整个机房的建设,为客户提供了可靠的解决方案。

孙伟还就联想液冷服务器技术细节进行了详细介绍:在绿色数据中心建设上,需要一个庞大的基于液冷技术的基础设施体系,来满足日益复杂的算力建设需求。联想建立了海神液冷技术体系,为多元的计算场景进行全面的绿色赋能。据孙伟介绍,联想海神液冷技术体系分为机柜级、液冷辅助、直接液冷、浸没式四大部分,可以为不同规模和场景的数据中心提供更优选择。对于一些希望采用高算力芯片,但又不具备机房改造条件的用户,可以采用风液混合的液冷辅助技术来提高局部的散热效率,简单易行。对于一些新建数据中心,智算中心等高性能负载用户,可以通过联想直接液冷技术,实现高性能和低能耗。通过液冷冷板系统的热交换,来带走主要功耗部件乃至全部功耗的部件的热量,大幅度降低由风扇和环境空调带来的能耗。

关于联想温水液冷技术的优势,她小结了几点:1,采用直接温液冷却+液体辅助空气冷却+后门热交换器的创新技术,大大降低了能源消耗;2,温水冷却消除了冷水冷却所需的大部分结构空间,节约了宝贵的空间资源;3,温水冷技术的液冷介质是水,不仅成本低,同时也避免了氟化液制冷的处理和运维问题。

孙伟表示,经过他们团队通过大量实验数据分析发现,进水温度最高50℃,出水温度58℃左右,能够获得更优的能耗比和经济效用。这样一来,一方面室外侧散热效率更高,满足AI算力需求下,CPU计算、GPU计算以及CPU+GPU等异构计算带来的性能提升的同时更少能耗;另一方面可直接满足城市地暖、热水供应对水温的要求,利于数据中心余热利用。

在安全性方面,联想温水液冷技术采用了创新可靠的快速断开连接器和枢轴管道,不仅提高了系统的安全性和可靠性,也降低了运维成本。

整体看下来,笔者发现联想海神温水液冷技术可为科学计算、通用计算、人工智能计算等多元场景带来绿色高效发展,可实现100%服务器部件用水冷却,热移除效率最高可达98%,这也就是为什么叫海神液冷技术体系了,这是汇集了产品研发、设备节能、制冷技术以及智能运维等多个维度的联合攻关的结果,可以说体系的胜利。

关于联想最新推出的液冷产品,孙伟专家透露在针对科学计算的液冷节点上,联想坚持高计算密度、高稳定性、高安全性和低PUE“三高一低”的设计思想,联想新一代海神(Neptune™)温水液冷系统在42U的标准机柜中,最多可以支持144张最新的GPU和72个CPU,单机柜达到约7.5PFlops双精度计算能力。它采用了冷板全液冷设计方案,功耗器件覆盖高达98%,PUE最低1.05,覆盖了CPU、GPU、内存、硬盘等所有关键部件,并且无风扇的设计,能够减少风扇故障点,实现0噪音。值得一提的是,在目前大热的AI算力方面,联想于上周发布了两款AI服务器新品。其中的联想问天WA7780  G3  AI大模型训练服务器,即在提供澎湃算力的同时,从设计上预留了液冷冷板设计,未来将支持液冷,大幅降低AI大模型训练过程中,因系统散热带来的额外能耗,助力AI算力绿色发展。

接下来,孙工程师给笔者介绍了一些他们团队液冷服务器的成功实施案例:在中国,联想助力高校科研、制造、气象海洋、生命科学等多领域客户部署液冷超算中心,持续提供着领先成熟的算力解决方案。例如在制造行业,联想液冷团队助力吉利汽车集团打造了吉利星睿智算中心·智能仿真平台,联想海神(Neptune™)温水液冷技术的应用,使得整个数据中心PUE值接近1.1,远低于政府要求,实现新车制造绿色与安全同行。此外,联想集团为北京大学打造的国内首个温水液冷高性能计算平台未名一号,每年为北京大学节省  60 万度电,降低 50% 的制冷散热成本。孙伟所在的联想液冷团队还承担冬奥会气象预报任务的北京市气象局提供了高性能计算系统。

国际上,联想液冷服务器更加被广泛使用,光是孙伟老师参与的项目就包括:韩国气象厅(KMA)、德国马普计算和数据中心(MPCDF)、欧洲顶尖理工大学KIT,澳大利亚国家计算机基地(NCI)等,最近联想还宣布德国波茨坦气候影响研究所(PIK)已选择使用联想HPC及海神温水液冷解决方案开发下一代高性能计算机,这将帮助人们更加深入了解气候变化,部署具有变革性的高能效应用。

接下来,联想液冷研发团队还将在四个方面持续创新和引领未来液冷技术:

第一,将通过相变冷板液冷技术解决高于千瓦的芯片散热问题;

第二,将利用内存液冷扣板代替“冷板内存”,提高内存液冷覆盖效率;

第三,将通过48v整机柜电源与全液冷结合的技术,持续追求整机柜能效极致;

第四,不断落地先进数据中心,持续改进运维和流控,从而提升浸没式液冷的实践效果。

着眼于更长远的未来,联想基于全栈智能布局,通过科技赋能,面向制造、政府、教育、金融、运营商、互联网等诸多行业,提供全栈智能与绿色低碳相融合的产品及方案服务,加速AI与行业实现深度融合,为更好地推动中国经济迈向高质量发展贡献智慧与绿色力量。

编辑:rwzh4

分享