实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

科大讯飞的星火V3.5模型在语音交互上实现重大升级,其全语音交互功能接近GPT-4,提供超逼真的真人语音体验。在多项能力测试中,星火V3.5在语言理解、数学和代码理解上表现出色,甚至超越GPT-4。此外,星火V3.5还具备快速生成PPT等实用功能,并在多模态理解和逻辑推理上有所提升。这款模型的实时语音交互和高情商应答,展示了其在语音技术领域的领先地位。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

白交 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。

今天,2024刚开年,讯飞星火就迎来重大升级:

  • 讯飞星火V3.5整体接近GPT-4 Turbo

  • 数学、语言理解、语音交互能力超过GPT-4 Turbo;

  • 代码达到GPT-4 Turbo 96%;

  • 多模态达到GPT-4V 91%。

560b12f40bd1412643d88b18716911dd.png

尤其在语音交互功能上,超逼真的真人语音生成,直接让线上网友惊叹三连:

8a536b15dafa8e5fc766b2ee3963ea2a.png
ae2d87ce65935bea93f112f053cb0a47.png

还有更多实用功能,比如现场几十秒的时间生成22页PPT!这速度,很快啊……

2cb1e0c22824f13b6aada60f29863777.gif

而围绕着这个大模型底座,科大讯飞还有一揽子产品和场景应用输出。

  • 国产首个语音大模型

  • 星火开源大模型“星火开源-13B”

  • 讯飞翻译机升级

  • 面向教育行业的智慧黑板
    ……

从基础模型到应用场景,下面一起来看。

讯飞星火V3.5底座能力升级

讯飞星火V3.5除了七大能力全面提升,整体能力接近GPT-4,还特别在语言理解、数学等能力上实现超越。

尤其对中文的理解更占优势,具体数据对比如下:

  • 语言理解、数学能力超过GPT-4 Turbo;

  • 代码打到GPT-4 Turbo 96%;

  • 多模态理解达到GPT-4V 91%

……

如果看数据图表还不够直观,我们也提前实测了一番。

就拿此次网友最为称道,也是本次更新最大的亮点——全语音交互,不是语音消息那样一条一条的,而是像打电话一样实时交互,下面先来看一段视频演示:

星火这一波应对得怎么样,算不算得上高情商?

要注意视频没有做加速处理,讯飞星火V3.5的语音响应就是这么快,与ChatGPT的语音交互相比,省去了大量“等待AI思考”这个环节,整个对话过程更流畅。

“聆飞逸”、“聆小玥”分别对应男女声两种音色,可自由切换。在音色自然,还像人一样时不时有停顿、“嗯……”等语气词。

在有感情,拟人度等方面,对比ChatGPT的“Ember”、“Juniper”音色也不遑多让。

5e4f81fe3a62217f4b022b6737384dd1.png

在交互模式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值