ChatGPT 高级语音功能(AVM:Advanced Voice Mode)正式上线!
好消息与坏消息同时到来。ChatGPT 终于推出了备受期待的高级语音功能(AVM),但遗憾的是,这次更新未包含之前演示过的视频对话和屏幕共享功能。目前,这项高级语音功能正在逐步推送给 ChatGPT Plus 和 Team 用户,建议相关用户尝试重新登录以确认是否已获得访问权限。
新功能亮点
视觉升级
高级语音功能采用了全新的蓝色动画球体设计,取代了旧版的黑色动画点,视觉效果更加现代和友好。
多样化语音选择
此次更新新增了五种语音:Arbor、Maple、Sol、Spruce 和 Vale,使 ChatGPT 的语音总数达到了九种。用户可以根据个人喜好选择不同的语音,享受更个性化的互动体验。
增强用户体验
高级语音模式新增了自定义指令和记忆功能,进一步提升了使用体验。现在,ChatGPT 可以用超过50种语言表达“对不起,我迟到了”,虽然在实际测试中语音识别的稳定性还有待提高,错误率比预期稍高。
使用限制
高级语音功能目前仅限于 ChatGPT Plus 和 Team 用户,并非所有地区均可使用。具体来说,欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户暂时无法体验这项功能。此外,高级语音的使用并非全天无限制,超过每日限额后,系统会自动切换回标准语音模式。
使用时间
从 ChatGPT 版本 1.2024.261 起,高级语音功能已在 iOS 和 Android 移动应用中上线。本周内,所有 Plus 和 Team 用户将逐步接收更新,企业和教育用户预计下周获得访问权限。
语音类型对比
高级语音
-
利用 GPT-4o 的原生音频功能,提供更自然的实时对话。
-
能捕捉说话速度等非语言线索,并带有情感回应。
-
Plus 和 Team 用户每天有一定的使用限制。
标准语音
-
对所有已登录 ChatGPT 的用户开放,通过 iOS、macOS 和 Android 应用使用(网页版尚未支持)。
-
使用多模型生成响应,需先将语音转录为文本后再处理。
-
每个语音提示计入消息条数限制,适合不需要多模态支持的用户。
使用提醒
当接近每日高级语音使用限额时,系统会发出通知提醒用户(例如,当剩余使用时间仅剩15分钟时)。一旦达到限制,当前对话将结束,并自动切换到标准语音模式继续对话,标准语音与底层模型共享消息限制。
其他功能
后台运行
开启“后台对话”功能后,即使切换到其他应用或锁屏,语音对话仍可继续进行,确保不中断用户体验。
对话恢复
高级语音对话可以在高级语音、文本或标准语音模式中恢复。然而,由于高级语音目前不支持图像功能,无法在高级语音模式中恢复带有图像的对话。标准语音对话则可以在标准语音或文本模式下随时恢复,但无法切换回高级语音。
有趣的应用场景
在标准语音对话中,用户可以直接指令 ChatGPT 创建图片。例如,可以让 ChatGPT 讲述一个故事,然后根据故事情节生成对应的场景图,增强互动的趣味性。
高级语音模式的推出,标志着 ChatGPT 在语音交互方面迈出了重要的一步。无论是日常对话还是专业应用,这项新功能都将为用户带来更加丰富和便捷的使用体验。快来体验一下吧!