GPT-4o 深夜炸场,科幻成真,这是流浪地球幕后黑手 Moss 的诞生

loonggg

读完需要

4

分钟

速读仅需 2 分钟

昨晚 OpenAI 召开了春季发布会,推出了一款叫:GPT-4o 的大模型。

最关键的点在于这个模型将向免费用户开放,你没看错,免费开放。这意味着人和人都可以通过 ChatGPT 访问 OpenAI 最先进的生成式人工智能模型技术。

为什么叫 GPT-4o ,而不是 4.5 或者 GPT- 5 呢?官方解读 o 的意思是:「o」象征着「omni」(意即全面、全能),显示出这款模型不仅具备文本处理能力,还能处理图像、视频和语音。

所以,omnimodel 指的就是文字、语音、图片、视频统一的模型,这是跟以往的 GPT-4V 最大的区别。

这是正儿八经的原生多模态。

而且 GPT-4o 大模型现在已经支持了实时联网功能,可以通过这个大模型查询最新消息。

今天一大早,我就收到了试用消息,赶紧体验了一波 GPT-4o 。

b53d585c263f6191bb6df66e1147f393.png

b0d64aeceade1f26ea5e075b48531ff3.png

顺便我试用了联网功能,比如,我问 GPT-4o :昨晚 OpenAI 召开了春季发布会,在发布会上 OpenAI 宣布推出了 GPT-4o ,在这个发布会上,有哪些我们普通人值得关注的要点?

4b4cc8fc06f8418d8a6b99af47f155fb.png

看到了吗?它经过搜索,找到了 6 条关于这个发布会的消息源,然后根据这些消息源生成了对应的回答。

关于这次发布会,值得我们普通人关注的要点大概有如下几个:

1、ChatGPT 将采用新的 UI ,更简洁,提升产品的可用性和便捷性,同时宣布今年晚些时候,将发布一个全新的 ChatGPT 桌面应用程序,支持 macOS,Windows 版本。

2、新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换。

3、惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表 。

4、GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。

5、能让广大用户收益的是 GPT-4o 将向所有用户免费开放,以后不需要付费花钱就可以体验最新的功能,文本、语音、图像都可以。另外,GPT-4o API,比 GPT 4-Turbo 快 2 倍的同时,价格便宜 50%。

让用户免费体验最新的技术,这绝对是王炸啊。

今天早上我看了网上的一些发布会的演示视频吧,给我一个很大的感受就是这种原生多模态的 GPT-4o 确实越来越像一个接近我们人类的新物种。

比如,一个演示视频是它能通过摄像头看到你,看到你周围的环境,从而判断你正在干什么,通过你的表情判断你的心情,这特么就像是长了眼睛一样。

另外一个演示视频是,它不仅能听懂你的语言,更能通过听到你急促的呼吸声来给你提建议,帮助你调整呼吸,让你放松下来。这就像是长了耳朵一样,而且这耳朵能听懂语言之外的声音,更加灵敏了。

眼睛长了,耳朵也灵敏了,那嘴巴呢?更强大了,GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,对话更像人、能实时翻译。你不仅能随时打断它,它也能随时接住你的话。它的声音也更加有感情了。

想来想去,就差一个鼻子了,以后再升级一下,给 AI 带上嗅觉,真的堪比人类了。

当然了,这一切都离不开 GPT-4o 大模型的大脑。就像开头所说的,GPT-4o 与现有模型相比,它最大进步在于,它可以实时对音频、视觉和文本进行推理——换句话说,它让 ChatGPT 实现了真正意义上的多模态交互 。

什么意思呢?以前比如用户和 ChatGPT 进行语音交流的话,大模型是先将语音翻译成文本,然后根据文本再去理解意思,生成内容之后,再将文本转换成语音回应给用户。中间经历了多个转换过程。

现在呢?GPT-4o 的解决办法是,跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。

这才是革命性的啊。

最后,欢迎大家加入我的知识星球「AIGC 掘金研习社」,里面有很多 AI 的玩法和落地应用场景,包括有 ChatGPT 的教程。

只需要 49 块钱可以享受全年各种教程更新的福利,相比于市面上的星球绝对超值。教程内容涵盖:ChatGPT ,AI绘画,AI音乐制作,国产AI 各种玩法和教程,还有 AI 副业变现内容等各种落地应用场景。

一年 49 元,平均一条 2 毛钱。绝对超值,目的就是带着大家入门。

a11368c9d360511d9d6d5d1e99e98c6a.jpeg

现在星球搞活动,立减 50 元,只需要 49,后期随着加入的人越多,价格可能上涨哈,早学早享受。

持续干货分享,绝对超值。

8a94a5a7ae2a930899d99ef724bd711f.jpeg

点击下方公众号卡片,关注我

在公众号对话框,回复关键字 “1024”

有惊喜

649c959712708cb8e93ebee9afbb5488.png

  • 10
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值