免费的GPT4终于要来了!OpenAI直播发布会详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

上周我在“重磅!5月13日下周一,OpenAI直播发布新功能!”一文中预告了OpenAI的这场被OpenAI CEO称为“magic”的直播发布会,本周一,它如约而至。

OpenAI果然没有令人失望。首先,主持人Mira Murati(OpenAI CTO)官宣了ChatGPT的桌面客户端,以及全新的web UI界面。其次,重头戏来了,Mira介绍了一款全新的模型GPT-4o,并且宣布这款GPT-4模型会对所有用户开放,当然包括免费用户!

ChatGPT桌面版客户端

根据Mira介绍,ChatGPT桌面版客户端即将公测,会最先推出macOS版本,然后会在今年晚些时候推出Windows版本。还是延续了OpenAI一贯的灰度发布的作风,目前已经开始陆续向用户推出。

我也收到了OpenAI的灰度测试,收到测试后ChatGPT会有信息提醒如下。注意,macOS版本目前仅支持Apple芯片的Macbook,系统要求macOS 14及以上。

为什么要发布桌面端?其中一大亮点就是可以直接共享电脑屏幕给ChatGPT,更加方便和ChatGPT对话。在直播后半程的demo中,OpenAI的Research lead给我们展示了这一功能。

最新的模型GPT-4o

直播发布会大概有效时长25分钟,至少有20分钟都是在介绍或者演示GPT-4o这个最新的模型。目前该模型已开始灰度发布,已经有不少小伙伴收到了这个新模型的使用资格。我也正好在今天下午就收到了体验资格。

收到灰度测试邀请的小伙伴在重新进入ChatGPT页面后会收到下面这个弹窗提醒。

在左上角模型选择处,已经多出来了一个GPT-4o的选项。

那么,为什么是GPT-4o模型?它牛在哪里?

多模态能力

GPT-4o,全名为GPT-4 omni,omni在英文里是“全能”的意思。

GPT-4o是一个本质上的多模态模型,能够深度理解和生成不同格式的内容,包括文本、语音和图像。这使得它可以在各种交互中更加灵活,例如接受语音命令或处理视觉数据。

理解能力是AI能够和我们人类进行交互的基础。而多模态级别的理解能力将会使得AI和我们交互方式更进一步。在直播发布会的后半程,OpenAI的研究人员为观众在实时对话中演示了这一最新模型的多模态能力,GPT-4o快速且正确地识别出了白纸上写的数学方程以及文字。这种多模态级别的理解能力虽然靠OCR识别实现,但它对外给人的感觉已经不再像一个应用程序,而是一个有理解能力的“智能体”!

实时语音和视频对话

注意,GPT-4o具有实时语音对话的功能!

可能有小伙伴能够联想到,之前ChatGPT以及Kimi Chat也有对话功能,也就是“语音模式”,你可以以语音的形式问问题,然后对方会针对你的问题进行回复,当然也是以语音的形式。但这种形式归根结底只能算是“对话”,而远远不是“实时对话”!比如,对于AI的语音回答,你必须从头听到尾,然后你再问,它再答。

什么是“实时对话”,就像是你和朋友打电话那样,你可以随时打断对方,表达自己的观点,而对方也能够理解你的意思,对给予回应。这就是新模型GPT-4o具有的功能,可以简单理解为由世界上最强大的LLM模型驱动的Siri,Alexa,小度和小爱同学。

在demo中,OpenAI的研究人员能够随意打断GPT-4o的讲话,就像是真正的对话那样。并且,GPT-4o的回复是实时的,而不是像以前那样,需要思考几秒钟(其实是在生成答案),然后再用语音回答,导致对话的体验很不连贯。更重磅的,GPT-4o甚至能够理解说话者的情感,具有了情感感知的能力!GPT-4o能够听到并判断出demo者在喘粗气,它会给出"slow down"的建议,并且,GPT-4o能够根据要求任意改变语调、音色等等,可以把音色加上各种从弱到强的感情色彩!

更快的响应速度

GPT-4o的响应速度是GPT-4 Turbo的两倍,这有助于更快速地应答和更有效地处理数据。同时,这也是为什么这个模型能够做到如此逼真的“实时对话”。

增加可访问性

Mira宣布,GPT-4o会在未来的几周内对所有用户免费开放,而付费用户的使用数量限制是免费用户的五倍。

支持API使用

对于开发者来说,该模型的API rate limit显著提高,是GPT-4 Turbo的五倍,允许在各种应用中更广泛地使用该模型,从简单的脚本到复杂的集成系统。

目前,GPT-4o模型的API已是可用状态,定价为GPT-4 Turbo的一半:

  • 输入:5 USD/1M Tokens

  • 输出:15 USD/1M Tokens


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

  • 19
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值