曦望发布新一代推理 GPU，探索人工智能算力新范式

在新一轮科技革命和产业变革深入发展的背景下，人工智能正加快从技术突破走向规模化应用。我国在数字经济、智能制造、新型工业化等领域对高效、稳定、可持续算力的需求持续增长，算力基础设施正成为支撑高质量发展的关键底座。

1 月 27 日，专注于推理算力的国产 GPU 企业曦望（Sunrise）在杭州举办首届 Sunrise GPU Summit。会上，曦望发布新一代推理 GPU 芯片启望 S3，并提出围绕推理场景构建算力体系，探索面向人工智能应用的新型算力服务模式。

这是曦望在近一年累计完成约 30 亿元战略融资后的首次集中对外亮相。与会专家认为，在人工智能发展从“训练驱动”迈向“推理驱动”的关键阶段，围绕推理算力夯实算力底座、提升算力供给效率，对推动人工智能赋能实体经济具有重要意义。

浙江大学信息学部主任吴汉明在发布会致辞中表示，过去十年，我国集成电路产业实现了跨越式发展，但随着人工智能进入规模化应用阶段，推理算力正成为制约应用落地和产业深化的重要因素。推理时代的算力竞争，已不再是单点技术能力的比拼，而是涵盖芯片设计、系统架构、软件平台和应用场景的系统性工程，需要构建协同创新、开放融合的产业生态。

这标志着集成电路供应链安全已上升至国家安全层面,实现了从"产业发展"到"安全保障"的战略转向,从"单点突破"到"系统能力"的体系升级,从"跟随创新"到"引领布局"的转型意图,要求在芯片设计、设备、材料等环节实现决定性突破,推动我国集成电路产业从"跟跑"向"领跑"跨越。

在这一背景下，一批面向推理场景的产业实践正在加快推进。围绕推理算力开展的系统化探索，正成为推动人工智能应用落地和产业深化的重要路径。

发布会上，曦望正式推出新一代推理 GPU 芯片启望 S3。该芯片面向大模型推理场景进行定制优化，重点提升推理效率和单位算力经济性，以更好支撑人工智能应用在实际业务场景中的部署需求。

据介绍，启望 S3 在推理场景下实现了性能、能效与成本的系统性优化，可满足长上下文、多并发等复杂推理需求。通过在芯片架构、存储体系和系统协同等方面的持续优化，S3 在典型推理负载下实现了显著的性价比提升，为降低人工智能应用成本、提升算力使用效率提供了有力支撑。

业内人士认为，推理 GPU 的持续迭代，有助于推动算力资源更高效地服务实体经济，为人工智能在工业制造、交通运输、医疗健康等重点领域的深入应用奠定基础。

在发布新一代推理 GPU 的同时，曦望还对外提出与合作伙伴共建推理系统级解决方案。

不同于传统以算力租赁为主的云服务模式，推理系统级解决方案以推理场景为核心，通过系统化整合计算资源和调度能力，将算力从单一硬件产品升级为面向应用的基础服务能力，降低人工智能应用部署和使用门槛。

曦望方面介绍，该平台以自研推理 GPU 为底座，通过与商汤科技、第四范式等合作伙伴协同，面向大模型推理需求提供更加稳定、可预期的算力服务，推动算力资源向实际生产力转化。

发布会现场，曦望与浙江大学签署战略合作协议，联合成立“浙江大学-曦望智能计算联合研发中心”。双方将围绕半导体虚拟制造以及人工智能在科学计算等领域的应用开展协同研究，推动科研成果向工程化和产业化转化。

曦望董事长徐冰表示，随着人工智能进入规模化应用阶段，曦望将持续围绕推理场景推进芯片、系统和算力服务的协同创新，推动算力基础设施向更加高效、可持续的方向演进，为我国人工智能产业高质量发展提供坚实支撑。

业内人士认为，以推理算力为核心、以推理系统级解决方案为载体的新型算力模式，正在成为人工智能时代的重要基础设施形态。曦望的相关探索，为国产算力体系建设和人工智能应用落地提供了有益实践。