重磅!谷歌发布Gemini Live,对标ChatGPT实时语音功能!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

在无数人的期待中,OpenAI曾高调发布的ChatGPT实时语音功能一拖再拖,几个月过去了,该功能还在alpha内测阶段,仅有少部分人能体验到。

而就在8月13日谷歌召开的Pixel 9系列手机发布会上,谷歌发布了其AI语音助手Gemini Live。很明显,Gemini Live对标的是OpenAI ChatGPT的实时语音功能。作为Google推出的最先进AI功能,集成了生成式AI技术的Gemini Live能够在智能手机上与用户进行多轮、自然的语音对话。其特点包括实时打断和互动能力、免提操作、多任务处理、多种自然语音选择,以及与Android系统的深度整合,使其能够根据上下文提供个性化、即时的帮助。

Gemini Live核心功能

与传统的Google Assistant不同,Gemini Live不仅能处理基本的语音指令,还能够进行多轮、自然的对话。用户可以像与真人交流一样,与Gemini Live进行对话——打断、提问、甚至纠正它的回答都变得更加直观自然。

这一功能得益于Google的增强型语音引擎,该引擎旨在提供更为一致、情感丰富、且极为逼真的对话体验。通过这一技术,Gemini Live不仅能快速响应用户的问题,还能在对话过程中实时适应用户的语音模式和习惯。

  1. 多轮对话的灵活性
    Gemini Live的多轮对话能力是其一大亮点。在与用户的互动中,它能够记住前面的对话内容,并在必要时引用这些信息。这种能力让对话变得更加连贯和自然,仿佛你在与一个真正的助手交流。例如,用户可以在询问工作面试建议时,连续提出多个相关问题,Gemini Live会根据对话的上下文逐步给出建议,而不仅仅是一次性的回答。

  2. 实时打断与互动
    在与Gemini Live对话时,用户可以随时打断,提出新的问题或修改原有问题。这种实时互动的方式,使得使用体验更加贴近真实的面对面交流。用户不再需要等待系统处理完所有指令再作出反馈,这极大提升了效率和用户体验。

  1. 免提操作与多任务处理
    Gemini Live支持免提操作,用户可以在手机锁屏或后台运行的情况下继续与助手对话。这意味着你可以一边处理其他任务,一边与Gemini Live保持互动,无论是在开车途中还是做家务时,这项功能都显得尤为便利。此外,用户还可以随时暂停对话,并在稍后恢复,这为长时间的对话提供了更多灵活性。

  2. 多种自然语音选择
    为了让用户获得最佳的听觉体验,Google为Gemini Live引入了10种全新的自然语音供用户选择。无论你喜欢温柔的女声还是沉稳的男声,Gemini Live都能根据你的喜好进行个性化设置。这种多样性不仅增强了用户的沉浸感,也让每个用户都能找到适合自己的语音风格。

Gemini Live功能限制

尽管Gemini Live在谷歌的宣传中展现了强大的功能和不错的用户体验,但目前仍有一些功能尚未开放。例如,Google曾在其I/O大会上展示了Gemini模型的多模态输入能力——通过摄像头识别周围环境并给出反馈的功能,但这一功能还未正式上线。此外,当前Gemini Live仅支持英语,但Google承诺将在未来几个月内扩展至更多语言,并推出iOS版本。

与OpenAI的高级语音模式类似,Gemini Live并非免费。它仅对订阅了Google One高级计划的用户开放,该计划的月费为20美元。不过,相较于OpenAI、Claude等其他AI付费服务,Gemini One的整体性价比还是相当可观的。

如何使用Gemini Live

目前,Gemini Live功能仅在安卓设备上开放,且已深度整合到Android的用户体验中,提供了许多只有在Android平台上才能实现的上下文感知功能。使用Gemini Live非常简单,只需长按电源按钮或说“Hey Google”,Gemini就会立即出现。

根据谷歌官方的宣传,当你在YouTube上观看视频时,你可以点击“询问关于此视频的问题”选项,Gemini就能根据你的视频内容提供相关信息或进一步的建议。如果你正在为出国旅行做准备,刚刚看完一个旅游视频,你可以要求Gemini列出视频中提到的所有餐厅,并将这些餐厅添加到Google Maps中。

由于Gemini与Android系统进行了深度集成,它不仅能读取屏幕上的内容,还能与许多你常用的应用程序进行互动。例如,你可以将Gemini生成的图像直接拖放到Gmail或Google Messages等应用中,这使得与AI的互动更加便捷和高效。

对于iOS用户,虽然目前Gemini Live还未上线,但Google已计划在不久的将来将这项功能扩展到iOS设备上。未来几个月内,iOS用户也将能够体验到这一强大的AI助手功能,并享受到与Android用户相同的无缝AI体验。


精选推荐

  1. 当我把凯特王妃的视频投喂给谷歌Gemini 1.5 Pro...

  2. 谷歌Gemini 1.5 Pro向所有人开放,无需waitlist!阿里通义千问升级1000万字长文档处理功能!

  3. 【全网首发】上周申请的谷歌Gemini 1.5 Pro已通过!百万token的Gemini 1.5 Pro开箱测试(一)

  4. 把Sora生成的视频发给谷歌Gemini 1.5 Pro会发生什么?!

  5. 重磅更新!谷歌发布Gemini 1.5 Pro!多模态,1000K上下文!附Waitlist链接!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

  • 10
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值