重磅!ChatGPT实时语音终于要来了!附详细使用说明

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

对于AI领域的领头羊OpenAI,你在期待什么?GPT-5还是文生视频模型Sora?或者是ChatGPT实时语音功能

对于ChatGPT实时语音功能,我们等了太久。而今天,它终于要来了!

就在刚刚,OpenAI通过社交媒体官宣,实时语音功能(OpenAI官方命名为:Advanced Voice Mode将在本周内向所有ChatGPT Plus和Team会员用户推送。同时,OpenAI还为实时语音功能添加了自定义指令(Custom Instructions)记忆(Memory)五种新声音(five new voices),以及改进的口音(improved accents)

如何判断有没有被推送到实时语音

如何知道自己已经被推送到实时语音功能了?很简单,在手机上打开ChatGPT app,点击页面右下角(输入框右侧)的语音按钮,如果你的账号已经被推送了实时语音,那么会看到下面这个截图中的确认信息。

点击Continue,ChatGPT会指导你开始选择你喜欢的声音音色,此时已经可以看到新增加的五个声音了,标记为NEW的就是新声音。点击每种声音,可以进行试听,选择你喜欢的声音即可。

点击Done,就可以开始和ChatGPT愉快的语音聊天了!

如果还没有被推送到这个新功能,则会在常规的语音聊天页面看到下面这个提示。

Advanced voice mode is on its way

Advanced voice mode is starting to roll out to all users. You don't have access yet, but check back soon to start using the new features.

ChatGPT的9种声音

算上新增加的五种新声音,目前ChatGPT内共有9种声音可以选择。

  1. Sol(NEW)– 聪慧且放松 (Savvy and relaxed)
    这是一种聪明而悠闲的声音,适合想要一种轻松愉快对话体验的用户。

  2. Ember – 自信且乐观 (Confident and optimistic)
    这是一种充满信心和积极向上的声音,适合传达坚定与热情。

  3. Maple(NEW)– 活泼且坦率 (Cheerful and candid)
    这是一种充满活力和真诚的声音,适合轻松、开朗的对话。

  4. Arbor(NEW)– 随和且多才多艺 (Easygoing and versatile)
    这是一种随和且适应性强的声音,适合多种对话场景,给人轻松自然的感觉。

  5. Juniper – 开朗且积极 (Open and upbeat)
    这是一种充满开放和积极向上情绪的声音,适合愉快的交流场景。

  6. Vale(NEW)– 明亮且好奇 (Bright and inquisitive)
    这是一种充满好奇心和求知欲的声音,给人一种明快而机智的感觉。

  7. Spruce(NEW)– 平静且充满肯定 (Calm and affirming)
    这是一种沉稳并富有肯定性的声音,适合营造安心的对话氛围。

  8. Breeze – 生动且真诚 (Animated and earnest)
    这是一种充满生气和诚恳的声音,适合表达热情与真诚。

  9. Cove – 沉着且直接 (Composed and direct)
    这是一种冷静且直接的声音,适合简洁明了的对话风格。

并且,OpenAI表示提高了部分外语的对话速度、流畅度和口音。虽然OpenAI并没有明确指出针对哪些外语(此处的外语指的是英语以外的语言)做了优化,但经过我的测试,在实时语音模式下,用中文和ChatGPT对话,ChatGPT的中文回复比之前强了很多,听起来更加自然流畅,没有之前那么生硬。

为什么推荐实时语音功能

很多AI工具都有语音对话的功能,为什么ChatGPT的这个实时语音功能令人期待?

如果你使用过之前的ChatGPT或者Kimi的语音对话功能,你应该能感觉到这些传统的语音对话还是没有跳出“一问一答模式”,你对它说一句话,它首先会调用LLM模型生成输出文字,然后用文字转语音模型将这些输出文字以语音的形式“念”出来,在它念完之前,你无法再和它进行任何对话,不能中途打断。

这样的对话并不是真正的“对话”。

相比之下,ChatGPT的实时语音则更加自然、流畅,体验已经无限逼近了现实生活中的实时对话。这一新功能让用户可以在与ChatGPT的对话过程中随时插话、打断,就像与真人进行电话交流一样,不再受限于AI一问一答的模式。并且,过去AI生成语音回答需要等待数秒,如今这种延迟已被消除,ChatGPT能够即刻理解并给出回应,使整个对话过程更加连贯。

此外,情感感知能力也是实时语音功能的亮点之一。ChatGPT不仅能理解用户的语音内容,还能够识别出情绪变化,比如用户在讲话时喘息,它会建议你“慢下来”。这种智能情感反馈让互动变得更贴近人类沟通方式,使对话更加真实自然。

如何才能使用实时语音功能

使用ChatGPT的实时语音功能需要满足2个条件:

  1. 拥有一个ChatGPT账号。

  2. 需要开通ChatGPT Plus或Team会员,因为目前实时语音功能仅对ChatGPT Plus和Team付费会员开放。个人用户建议开通ChatGPT Plus会员即可,高级模型(GPT-4o、o1)的使用次数足够个人使用了。

注意,ChatGPT的实时语音功能仅支持移动端(手机app)和Mac客户端,网页端是不支持语音功能的。

结语

之前一直等待ChatGPT实时语音功能的小伙伴可以行动起来了!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

阿里零售通如意POS S1是一款由阿里巴巴推出的智能收银机,作为小店的"大脑",它能够为小店提供更加便捷、高效的收银服务。 首先,如意POS S1采用了先进的人工智能技术。通过与阿里巴巴的大数据平台连接,它可以准确地识别商品信息,实现自动识别、结算和统计功能。无论是快速扫描条形码还是人工输入商品信息,都能够快速记录和结算,避免了繁琐的手工操作。 其次,如意POS S1拥有丰富的功能扩展。它支持支付宝、微信支付等多种支付方式,能够满足顾客的多样化支付需求。同时,它还可以通过连接蓝牙打印机、电子秤、扫码枪等外部设备,实现更多个性化的需求,提升小店的运营效率。 此外,如意POS S1还具备强大的数据分析和管理功能。它能够实时监控库存情况,提醒小店及时进货,避免断货情况的发生。同时,它还能根据销售数据进行分析,为小店提供经营建议,帮助小店主了解销售情况和市场趋势,做出更加明智的经营决策。 总的来说,阿里零售通如意POS S1的重磅上线为小店带来了新的智能化解决方案。它通过人工智能、丰富的功能扩展和数据分析,实现了小店收银、支付和管理的一体化,为小店提供了更便捷、高效、智能的运营管理工具。小店可以通过使用如意POS S1,提升服务质量,提高销售额,并更好地适应市场竞争的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值