时间:2025-07-28 22:24 作者:酒池醉
WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能
7月28日消息,2025世界人工智能大会(WAIC)上,声网正式发布其新版对话式 AI 引擎,该版本新增声纹识别、数字人与视觉理解三项核心功能,实现从“能说话”到“能理解、能共情”的跨越式升级,进一步拓展对话式 AI 在多模态交互中的边界。
据介绍,新版引擎引入声纹识别功能,可精准识别个体声音特征,有效区分多说话者并屏蔽背景噪音,为多用户并发对话提供技术支撑。
数字人能力方面,声网支持接入如商汤等主流方案,赋予 AI 拟人化表情与动作,适用于虚拟客服、教育陪伴等情境对话场景。
视觉理解功能则令 AI 能“看懂”用户环境与图像信息,支持拍照识图与实时手势识别,实现“所见即所说”。
在WAIC现场,声网同步展示了一系列搭载该引擎的 AI 硬件,包括 AI 毛绒宠物“芙崽 Fuzozo”、家庭陪伴机器人“赋之 EBO Air 2 Plus”,以及集成双屏/单屏对话式 AI 开发套件的玩具与教育终端,覆盖从儿童教育到智能陪伴的多样场景。(袁宁)
1、匈牙利人祖先来自东方,但既不是欧亚草原的匈奴,也不是突厥后裔,匈牙利人的起源
2、硬蛋创新(00400):以边缘AI算力“Nvidia Jetson”为基石,赋能人形机器人赛道
3、国家防总针对上海江苏浙江启动防汛防台风四级应急响应,防台风4级响应是什么概念