黄仁勋押注端侧Agent,这条路明略科技已经走了两年

来源:东方网
2026-06-04 13:56:35
分享

6月1日,黄仁勋在台北音乐中心发表GTC主题演讲。RTX Spark、NemoClaw、OpenShell、Jetson,密集的产品发布指向一个明确的方向:Agent正在从云端走向端侧,从工具进化为数字同事。

当NVIDIA用一整场发布会把它具象化时,一个问题随之浮出:谁已经在做了?

明略科技(2718.HK)或许是目前可观察到的、把这条路线走得最完整的中国AI公司之一。过去两年,这家去年以“全球Agentic AI第一股”身份登陆港交所的公司,围绕端侧模型、推理引擎、Agent协作和硬件入口搭建了一套完整的技术栈,并在自己的组织内部做了一场真实的验证实验。

数据分三层,第三层只能交给端侧

明略科技内部有一个判断框架:企业数据按敏感度天然分为三层——可公开的、可脱敏的、绝对私有的。

前两层的AI化路径已经成熟,接上云端大模型API就能获得不错的智能增益。但第三层不行。客户的交易明细、未出街的广告创意、正在谈判的商务条款、内部的组织决策流程——这些数据构成企业真正的竞争壁垒,也踩在合规红线上。能不上云,就绝不该上云。

问题在于,这些数据也最需要AI。

企业客户过去一年面对同一个困境:核心数据不能出域,业务又迫切需要AI提效。云端大模型解决不了这个矛盾,能解决的只有足够强的端侧智能。

这正是明略科技开发Mano-P的出发点。Mano-P不追求千亿参数的规模竞赛,设计目标非常具体——在企业数据不出域的前提下,提供GUI操作和多模态交互能力。在OSWorld基准测试中,Mano-P在小尺寸模型中排名全球第一。

明略团队的判断是:端侧模型不是大模型的降级版。在特定场景下,它比云端更重要——离数据更近、延迟更低、隐私更强。

黄仁勋在GTC台北发布RTX Spark时说:“PC正在被重新发明。”NVIDIA和微软联合推出的OpenShell安全运行时,让Agent在本地安全运行,把隐私查询智能路由到端侧模型。明略科技将自己的路线称为Scaling Out——不是把数据喂给一个集中式大脑,而是让智能分布式地生长在数据产生的地方。

你的 Mac 不只是你的工具,也是 Agent

黄仁勋的RTX Spark回答了Windows生态的方案,但端侧AI的机会不止一个平台。

明略团队很早就注意到,Apple Silicon的统一内存架构和Neural Engine算力天然适合端侧推理。开发者社区的行为也在验证:大量推理框架正在为Apple Silicon做深度适配。Mac正在从一台“人的生产力工具”,变成AI Agent最好的物理载体之一。

这就是Cider的由来。Cider是明略科技自研的端侧推理引擎,专门为Apple Silicon优化。它降低了Mano-P等端侧模型在macOS上的部署门槛——Agent驻留在用户设备上,持续感知屏幕、理解界面、操作应用,不需要把任何数据上传到外部云端。

到这一步,明略有了模型,有了推理引擎,Agent可以在一台设备上独立工作。但现实中的企业不只有一个Agent——一个处理客户响应,一个整理数据报表,一个执行合规检查,它们之间需要协作,就像人类同事之间需要沟通一样。

明略科技继而开发了Octo和Octic。Octo是开源的Agent协作网络,让Agent之间能互相通信、分工、协作;Octic则是硬件端点,负责物理世界中Context的采集。如果说Mano-P是Agent的手和脚,Cider是加速框架,Octic是感官,那么Octo是它们共同协作的平台。

四个组件串起来,构成了一条完整的链路:端侧模型提供智能,推理引擎提供算力适配,硬件端点提供感知采集,协作网络提供组织能力。每一层都在端侧或企业私域内运行,数据主权始终在用户手中。

2900+ Agent 已经在上班了

技术栈搭完只是第一步。明略科技选择了最直接的验证方式——在自己的组织里跑起来。

目前Octo已接入1400余名人类员工和2900余个Agent。员工和Agent在同一个协作网络里分工:Agent处理数据整理、报告生成、流程执行、客户响应,人类专注于判断、决策和创造。

效果已经体现在数据上:秒针系统全链路AI自动完成率达到90%,人效提升超20倍;户外广告监播效率提升4倍;私域客服人力成本同比下降71%。

GTC台北上,黄仁勋反复用“digital coworker”来定义Agent。Cadence、达索、西门子等公司通过构建“自主AI工程师”,把数周仿真验证压缩到数小时。而明略科技的实践表明,Agent作为同事协作这件事,在营销智能、线下营运等场景同样成立。

当Agent真正成为同事,商业模式也在变。黄仁勋指出,AI工厂是Token工厂,衡量竞争力的单位从FLOPS变成cost-per-token。明略科技的体会类似——企业不再为“使用工具的权利”付费,而是为Agent完成任务的结果付费。每一个Token消耗对应一个具体的业务产出:一份分析报告、一条客户线索、一个合规检查。

明略科技创始人、CEO兼CTO吴明辉曾表示:“2025年,明略科技完成了一次关键转型——从帮助客户‘看懂数据’,到帮助客户‘拿到结果’。Agentic Services的意义,正是在于推动AI的价值从工具交付走向结果交付。”

数据也在验证这个方向。2025年,明略科技Agentic Services业务上市首年即超1亿元营收,新增大客户中超过30%来自该板块。围绕营销场景,明略科技已打通从数据洞察、内容生产与分发到营销投放的端到端业务流,以近3倍的运营效率帮助客户实现平均20%的营销效果增长。

端侧AI不是云端的降级替代。在明略科技的实践中,它正在成为让企业数据资产真正转化为智能生产力的原生路径。

关于明略科技

明略科技(2718.HK),成立于2006年,中国领先的具备自研模型能力的Agentic Service企业。2025年作为"全球Agentic AI第一股"登陆港交所。曾两度斩获吴文俊人工智能科学技术奖,多次入选Gartner、IDC相关报告,拥有2400余项技术专利及500余项软件著作权。

近年来,明略科技在Agentic AI领域持续突破:自研超图多模态大模型(HMLLM)斩获ACM MM 2024最佳论文提名;VLA模型Mano登顶Mind2Web、OSWorld双榜SOTA;2026年开源端侧GUI-VLA智能体模型Mano-P,登顶OSWorld等9个榜单;开源Apple Silicon推理SDK Cider;开源Agent协作平台Octo,并推出首款AI Native录音硬件Octic,构建“模型-平台-硬件”闭环。

依托20年技术积累,明略科技已服务135家财富世界500强、约2100家品牌客户及超24万家企业用户。

分享