搜索
房产
装修
汽车
婚嫁
健康
理财
旅游
美食
跳蚤
二手房
租房
招聘
二手车
教育
茶座
我要买房
买东西
装修家居
交友
职场
生活
网购
亲子
情感
龙城车友
找美食
谈婚论嫁
美女
兴趣
八卦
宠物
手机
打印 上一主题 下一主题

豆包实时语音大模型正式上线!端到端语音对话 情商智商双高

[复制链接]
查看: 26|回复: 0

19万

主题

19万

帖子

58万

积分

论坛元老

Rank: 8Rank: 8

积分
587925
跳转到指定楼层
楼主
发表于 2025-8-1 21:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
豆包实时语音大模型震撼上线,全方位提升语音交互体验!
今日,字节跳动豆包大模型团队隆重推出豆包实时语音大模型,现已在豆包App全量开放。升级至7.2.0版本即可亲身体验这一语音交互领域的重大突破。
豆包实时语音大模型集语音理解和生成于一体,打造端到端语音对话。与传统的级联模式相比,其在语音表现力、控制力、情绪承接方面展现出卓越性能,且具备低时延和随时打断对话等特性。
该模型专为中文语境和场景设计,采用语音和语义联合建模,赋予其丰富的表现力,呈现出接近真人水准的语音表达。通过学习角色语音和情感特点,模型具备强大的讲故事能力,可生动切换不同角色/状态,配合不同情绪表达,提升交互趣味性和沉浸感。
联合建模后,模型涌现出非凡的指令理解、声音扮演和声音控制能力。目前,模型部分方言和口音的识别源自Pretrain阶段数据泛化,而非针对性训练。
豆包实时语音大模型输出的语音高度逼近真人,包括类人的副语言特征(如语气词、停顿思考等)。同时,实时联网功能赋予模型获取最新信息的强大能力,对时效问题可精准、及时地回应。
技术展示表明,该模型语音语气自然度和情绪饱满度逼近真人,对话风格更加拟人,情感理解更加深刻,对用户的情绪做到较好承接。不过,现阶段模型仅支持中文,其他语种和方言的支持仍在探索中。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2006-2014 oopz大明星网,男女明星图片,明星八卦新闻,明星个人资料大全 版权所有 法律顾问:高律师 客服电话:0791-88289918
技术支持:迪恩网络科技公司  Powered by Discuz! X3.2
快速回复 返回顶部 返回列表