阿里云助力赛博创力研发多模态互动AI底座——创新影视IP互动体验

来源:中国网科学
2024-09-09 16:50:53
分享

随着AI基础模型等技术进步,AI软件平台功能日渐强大,但软件往往缺乏与真实世界的直接交互,虚拟与现实间的隔阂仍待打通。用户对于丰富沉浸式AI体验的需求日益增长,正推动着AI硬件领域的创新。2024年被誉为AI硬件的启航之年,AI创业者摩拳擦掌,视AI硬件领域为充满机遇的新蓝海,竞相投身其中。

赛博创力是AI原生硬件创业团队,他们对AI硬件的押注早于市场热度之前,而切入点是儿童教育及陪伴赛道,在阿里云通义千问等技术产品的支持下,赛博创力已经研发出多款AI互动玩具等产品,成功销往海外。

近日,在阿里云联合优酷发起的Create影视IPxAI应用创新大赛暨“创客北京”专项赛中,赛博创力基于自身硬件技术,结合阿里云通义千问、函数计算技术以及优酷热门影视IP网剧《少年白马醉春风》,打造出角色互动聊天的AI底座“IP风格AiSpea base”,创新了影视IP的多模态互动体验,获得此次赛事的“AI技术突破奖”。

本期「看见新力量」栏目与赛博创力CEO周羿旭进行对话,由他带领我们走进AI互动体验的全新探索。

01 AI创业新共识,奔向AI硬件

移动互联网的广泛普及曾催生了一次智能硬件的发展浪潮,而今,在AI大模型的强大赋能下,智能硬件有望实现新一轮的智能化飞跃,这将是更大的创新机遇。今年以来,多个从传统硬件企业、互联网大厂走出的创业团队,选择了智能眼镜、AI儿童玩具、AI录音机等创业赛道。

“我们是从去年11月底开始做AI儿童玩具的,那时候更多人的目光还停留在大模型中台之类的偏软件项目上。”周羿旭回忆,在此之前,他在浙大人工智能实验室担任助理,研究多模态大模型应用,联合创始人刘岱轩来自IBM、擅长硬件嵌入式开发和软件开发,团队技术人员接近70%,这是他和团队第一次全身心投入创业。

技术优势是赛博创力的第一层底气。“我们跟很多做类似应用的伙伴聊过,从反馈上看,我们的技术进展是具备一定优势的。”周羿旭介绍,具体来说,体现在产品响应速度、稳定性和安全性上的差距。

响应速度直接关系到AI硬件的性能和用户体验,赛博创力在通义千问大模型的基础上,做了音频实时输出上的优化,实现更快速响应。稳定性和安全性的完善则依赖于时间和探索,由于启动时间比较早,团队已经完成了多项技术难题的跨越,例如将大模型创造力融合小模型的模式,带来了更好的安全性效果。

以技术为基础,赛博创力选择了儿童教育陪伴赛道作为产品的落脚点。与其他群体相比,儿童更容易接受新的交互方式且有着强烈的情感陪伴需求,更重要的是,大模型的幻觉等问题不会成为沟通障碍,儿童天马行空的想象力会在与AI的沟通中产生更多乐趣。赛博创力据此研发了包括AI毛绒玩具、桌面小机器人、AI智教相机等系列产品。

(赛博创力产品图片)

产品销量体现了市场反馈,给了赛博创力进一步的信心。据周羿旭介绍,赛博创力的AI毛绒玩具等产品,采用ToB销售的模式,主要面向采购商尤其是海外采购商,目前已经做到了批量出货,公司实现正向盈利,这在国内同类型产品中并不多见:“ToB这块我们已经能赚到钱养活自己,未来一方面要继续在技术上保持领先,另一方面在产品理念上继续保持优势。”

对于AI硬件赛道的创业者,尤其是初创型团队来说,保持技术的领先的秘诀是“让专业更专业”:在基础设施上找到最强的合作伙伴,在垂直小模型上不断打磨。

赛博创力选择了阿里云通义大模型和阿里云云计算服务器。“通义千问响应速度非常快,包括纯文本版本和视觉版本。”周羿旭表示,这帮助赛博创力实现了产品响应速度的提升。同时,云计算服务器的使用,也有效降低了团队的研发成本。

云上部署可以说是创作类型使用算力花费的最优解。AI技术的迅速崛起,带动了GPU算力需求达到一个又一个波峰,企业和创作者们在初期都非常关注GPU算力的“使用成本”。通过使用云计算来进行快部署,把大模型和AI创作平台托管上云,具备简单维护、简单运营的特点,同时云厂商通常提供灵活的扩展选项,根据需求快速增减资源,可根据需求降低成本,先人一步享受AI带来的技术红利。阿里云也会给新用户提供各种免费的产品和算力资源,让企业能够快速进行尝试,极大降低了“试错成本”。

而在未来的竞争中,周羿旭还期待大模型的进一步进化:“通义千问目前比较适合通用场景的用户,未来希望底层技术上能迭代一些针对性的优化模型。”

02阿里云AI技术加持,带来影视互动的全新体验

儿童教育赛道之外,赛博创力也在关注更多AI+硬件的创新方向。

在阿里云联合优酷发起的Create影视IPxAI应用创新大赛中,赛博创力第一次尝试AI硬件与影视IP的碰撞,将自主研发的AiSpea智能模组与阿里云通义千问、函数计算部署结合,根据网剧《少年白马醉春风》IP形象设计了不同AI角色底座和立牌。通过多模态、多角色agent交互、深度合成AI问答,实现用户和多角色硬件一起“群聊”。

(参赛作品图片)

此前,赛博创力已经实现了智能底座和人的一对一对话,为了深入融合网剧《少年白马醉春风》的内容,赛博创力在原底座基础上,利用阿里云通义大模型进行了新技术的研发。

“对话”对人来说近乎本能,但对AI来说,要实现多角色对话的流畅自然,需要攻克语境理解、多轮对话、知识图谱、实时响应等难题,这都需要依赖大模型的交互和理解能力。得益于其背后的自然语言处理(NLP)和机器学习算法等领先技术,阿里云通义千问在用户意图理解能力、多轮对话能力、多模态交互能力上表现突出,帮助赛博创力实现多智能体的互动对话,并且在用户体验上达到对话的流畅自然。

“倾听”理解是对话的第一步,通义千问能够精准地理解不同场景下对话的意图,提供更加准确和有针对性的答案,提升角色对话效率;其次,多角色互动意味着需要进行多轮对话,通义千问能够理解和记忆对话上下文,输出连贯的交流内容,就一个或多个话题进行复杂讨论,实现深层次的沟通;在对话输出层面,团队基于通义千问为每个角色建立了agent,多角色agent可以控制对话中的回答顺序和逻辑,让交互看起来更真实。

“未来我们会继续长期深入使用阿里云AI产品,一方面是通义千问大模型,另一方面是函数计算。”周羿旭表示,完成此次参赛作品设计的是团队中的非技术人员,通过运用阿里云函数计算AIGC工具,零基础人员也能实现角色设计、图像输出、场景生成、宣传视频等专业操作。

阿里云函数计算作为本次赛事的技术支持产品,为AI应用开发和部署提供算力和技术支持。据了解,阿里云函数计算FC是一款FaaS产品,这是一种以事件驱动为核心的全托管计算服务,用户只需编写代码并上传,函数计算就会自动准备好计算资源,以弹性、可靠的方式运行代码,并提供完整的可观测能力,大幅简化开发运维过程。

“从技术角度来看,我们在考虑未来把更多的主体服务部署转移到函数计算上。”通过本次大赛,周羿旭对阿里云函数计算产品的价值有了更深的体会:“尤其对我们这种中小团队来说,我们希望更多的精力聚焦于研发产品本身,而不是去做大量的维护工作。不管是面对业务量的自动扩缩容,还是从部署成本上来讲,阿里云函数计算产品对我们都是非常有价值的。”

影视IP提供的丰富场景和人物角色,是赛博创力设计参赛作品时体会到的另一个惊喜。通常的产品设计中,创作者需要创建角色,包括编写故事背景、撰写人物性格、创建人物音色等,而基于网剧《少年白马醉春风》的影视IP,创作者可以直接将十几万字的小说原著导入API创建里。“影视IP和AI技术有天然的跨界融合优势。”周羿旭总结,AI是不可阻挡的发展趋势,未来会继续延伸到影视IP新的互动体验形式。

作为大赛的主办方,阿里云相关负责人也表示:“内容产业在AI时代中的想像空间很大。在链路上,从创意发想、制作、发行、IP拓展,一直到版权保护等等,都可以在链路上产生效率的提升。”

03低门槛进入AI创作,让想象力落地

经过这次参赛探索,赛博创力更坚定了未来的发展目标:一方面,技术方向上继续研发偏角色化的具身智能玩具,除纯聊天外,还可以在动作上和用户互动,类似迪士尼发布的机器人瓦力;另一方面,在创作上,构建创作者社区平台,让更多创作者将自己的原创故事、角色等导入到平台中来,结合赛博创力AI硬件工具,降低创作者使用AI的门槛,每个创作者都可以自己设计独有的IP周边或角色立牌,结合硬件底座,直接跟自己喜欢的IP角色聊天。

“我们认为未来在一个产品中,可能创作者会比程序员有更重要的价值。”周羿旭举例解释,比如未来的家庭机器人,未来技术可能会越来越透明,躯体和零部件可能由几家公司或代工厂提供,但每一个机器人都应该有匹配不同嘉定的不同性格,“这里的差距要靠很多的创作者来创造,他们去设计丰富的机器人角色背景、故事等。我们的社区也是想要去吸引更多的创作者参与进来,更早去体验、更早去开始,只是创作而不用编程,就可以去设计一个小机器人的角色动作习惯。”

这与阿里云的思路不谋而合:AI的果实需要走出技术圈层,落实在每一个中小企业和创作者之中。除了高尖技术类型的发展,阿里云一直持续借由产品研发、降低应用门槛,让所有企业和创作者有同样公平的机会,在AI的时代发展中不落队。

对于AI硬件行业来说,目前正在还处在发展初期,儿童陪伴、影视创作等偏娱乐陪伴产品,不同于功能类产品有明确的技术拐点,其技术拐点比较模糊,无法确定做到什么程度能够带给用户良好的体验,非常考验创新团队产品定义、AI技术、需求把握等能力。也意味着,这个赛道需要经过AI技术迭代、产品功能完善、商业化成熟等一系列考验,市场爆发可能需要等待3-5年时间。

但未知的挑战从来挡不住创新的脚,阿里云会持续通过AI技术普惠更多的中小企业和创作者。同时,以赛博创力为代表的众多创新企业,扎根细分垂直领域,深度推动AI技术落地应用。在多方合力下,一个更繁荣的AI创新生态正在形成。相信未来,更多增加用户体验的创新产品将从中生长,带领我们进入一个全新的智能世界。(推广)

分享