声姿 | 思必驰×智元精灵G2：工业级交互，为生产力而声动

2025年全运会期间，智元机器人推出的工业级交互式具身作业机器人——智元精灵G2，在广州的交通枢纽承担乘客引导、问题解答及安全巡查等核心任务，此外还支持全场景全向避障与高精度力控作业，应用于汽车零部件制造、物流搬运及导览讲解等场景。思必驰为其提供软硬一体化的语音交互解决方案，成为智元精灵G2赋能产业升级的关键支撑。

声智协同，产业场景交互更精准

针对地铁站、展馆、博物馆等多样化场景，思必驰为智元精灵G2量身打造行业专属语音交互方案，实现流畅精准的设备控制与场景响应。用户通过语音即可切换作业模式、调整参数，系统具备强抗干扰与指令定制能力，支持中英文及多方言实时互译。

在博物馆，G2可基于用户画像动态切换讲解风格，提供深度知识延伸与主动导览；在地铁站，它能在嘈杂环境中准确锁定对话人，实现出行指引与安全提醒；在展厅，则支持多轮连贯交互与VIP专属服务，实现“边走边讲”的沉浸式导览。适配多场景的智元精灵G2，正推动智能交互在实际应用中全面落地。

人形适配阵列，拾音无死角

针对智元精灵G2的类人形态与运动特性，思必驰采用离散型环四麦克风阵列方案，科学排布、定向拾音，无论在静止巡检或移动作业中，均可实现广域高精度语音捕获，确保指令“一说即中”，不受机身转动影响。

全链路语音，交互一气呵成

端到端的全链路语音交互系统，实现从唤醒、识别、语义理解到语音反馈的无缝衔接。可以接收连续的复合指令，摆脱重复唤醒，提升作业效率，交互如协同办公般自然。

大模型底座，低延迟稳定交互

思必驰通过自研的AISPEECH DFM语言计算大模型，构建了以中枢大模型为技术底座、串联语音交互技术与行业专业模型的“1+N分布式大模型智能体系统”，低延迟与高可靠性并行，助力G2实现精准语义理解与场景化应答，提供稳定智能的对话支持。

智慧降噪，动态应对噪声

基于思必驰AI智慧降噪技术，G2可实时感知环境的噪声变化，动态调整降噪策略，有效过滤设备运行声、风扇噪声、人声混杂等干扰，确保关键指令在嘈杂环境中依然清晰可辨，拒绝“噪中失聪”。

深度回声消除，抗干扰更强

深度学习的回声消除算法，对工业场景中常见的非线性噪声与复杂声学反馈具备更强抑制能力，有效克服机器人自发声与环境噪声的混合干扰，提升高噪声工况下的识别鲁棒性。

360°声源定位，识别更精准

G2机器人支持360°全向声源定位技术，可准确判断发声人方位与距离，实现“声随人动、定向响应”的沉浸式交互。在多人协同作业场景中，G2能够“听音识位”，锁定指令来源，执行更精准、交互更专注。

工业智能化，因“声”而进化

智元精灵G2配备全球首款十字腕力控臂，全臂集成高精度关节扭矩传感器，结合3自由度腰部设计，可模拟人类弯腰、转腰动作。通过真机强化学习算法实现一小时内存条插接等精密操作，搭载双电池热插拔技术与自主充电功能，适配95%以上工厂地面环境。依托智元自研大模型实现本地AI算力低于10毫秒延迟，达到100%任务完成率。搭配思必驰的智能交互技术，从语音模组到场景算法，从单机交互到系统协同，持续推动G2机器人在工业环境中“听得清、听得懂、响应快、执行准”。

从体育赛事的公共服务，到工业生产的精密作业，再到商用场景的高效服务，智元精灵G2的出现，打破了工业机器人与商用机器人的场景壁垒，重新定义了工业级交互式具身机器人的核心标准，更是“AI+机器人”赋能产业升级的生动实践。

未来，随着AI大模型与机器人技术的持续迭代，思必驰将继续深耕工业级语音交互领域，与智元等合作伙伴携手，推动更多智能化、场景化的机器人解决方案落地，让“声动”赋能生产力，让智能改变产业与生活。