2025年全运会期间,智元机器人推出的工业级交互式具身作业机器人——智元精灵G2,在广州的交通枢纽承担乘客引导、问题解答及安全巡查等核心任务,此外还支持全场景全向避障与高精度力控作业,应用于汽车零部件制造、物流搬运及导览讲解等场景。思必驰为其提供软硬一体化的语音交互解决方案,成为智元精灵G2赋能产业升级的关键支撑。

声智协同,产业场景交互更精准
针对地铁站、展馆、博物馆等多样化场景,思必驰为智元精灵G2量身打造行业专属语音交互方案,实现流畅精准的设备控制与场景响应。用户通过语音即可切换作业模式、调整参数,系统具备强抗干扰与指令定制能力,支持中英文及多方言实时互译。
在博物馆,G2可基于用户画像动态切换讲解风格,提供深度知识延伸与主动导览;在地铁站,它能在嘈杂环境中准确锁定对话人,实现出行指引与安全提醒;在展厅,则支持多轮连贯交互与VIP专属服务,实现“边走边讲”的沉浸式导览。适配多场景的智元精灵G2,正推动智能交互在实际应用中全面落地。
人形适配阵列,拾音无死角
针对智元精灵G2的类人形态与运动特性,思必驰采用离散型环四麦克风阵列方案,科学排布、定向拾音,无论在静止巡检或移动作业中,均可实现广域高精度语音捕获,确保指令“一说即中”,不受机身转动影响。
全链路语音,交互一气呵成
端到端的全链路语音交互系统,实现从唤醒、识别、语义理解到语音反馈的无缝衔接。可以接收连续的复合指令,摆脱重复唤醒,提升作业效率,交互如协同办公般自然。
大模型底座,低延迟稳定交互
思必驰通过自研的AISPEECH DFM语言计算大模型,构建了以中枢大模型为技术底座、串联语音交互技术与行业专业模型的“1+N分布式大模型智能体系统”,低延迟与高可靠性并行,助力G2实现精准语义理解与场景化应答,提供稳定智能的对话支持。
智慧降噪,动态应对噪声
基于思必驰AI智慧降噪技术,G2可实时感知环境的噪声变化,动态调整降噪策略,有效过滤设备运行声、风扇噪声、人声混杂等干扰,确保关键指令在嘈杂环境中依然清晰可辨,拒绝“噪中失聪”。
深度回声消除,抗干扰更强
深度学习的回声消除算法,对工业场景中常见的非线性噪声与复杂声学反馈具备更强抑制能力,有效克服机器人自发声与环境噪声的混合干扰,提升高噪声工况下的识别鲁棒性。
360°声源定位,识别更精准
G2机器人支持360°全向声源定位技术,可准确判断发声人方位与距离,实现“声随人动、定向响应”的沉浸式交互。在多人协同作业场景中,G2能够“听音识位”,锁定指令来源,执行更精准、交互更专注。
工业智能化,因“声”而进化
智元精灵G2配备全球首款十字腕力控臂,全臂集成高精度关节扭矩传感器,结合3自由度腰部设计,可模拟人类弯腰、转腰动作。通过真机强化学习算法实现一小时内存条插接等精密操作,搭载双电池热插拔技术与自主充电功能,适配95%以上工厂地面环境。依托智元自研大模型实现本地AI算力低于10毫秒延迟,达到100%任务完成率。搭配思必驰的智能交互技术,从语音模组到场景算法,从单机交互到系统协同,持续推动G2机器人在工业环境中“听得清、听得懂、响应快、执行准”。

从体育赛事的公共服务,到工业生产的精密作业,再到商用场景的高效服务,智元精灵G2的出现,打破了工业机器人与商用机器人的场景壁垒,重新定义了工业级交互式具身机器人的核心标准,更是“AI+机器人”赋能产业升级的生动实践。

未来,随着AI大模型与机器人技术的持续迭代,思必驰将继续深耕工业级语音交互领域,与智元等合作伙伴携手,推动更多智能化、场景化的机器人解决方案落地,让“声动”赋能生产力,让智能改变产业与生活。