OpenAI新发布模型 | 你好GPT-4o

最新推荐文章于 2024-10-08 18:17:31 发布

MC云

最新推荐文章于 2024-10-08 18:17:31 发布

阅读量205

点赞数 10

分类专栏： openai AI ChatGPT 文章标签：人工智能 chatgpt gpt ai 机器人

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MCYUN_Shop/article/details/139031335

版权

openai 同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

OpenAI最新发布新模型GPT-4o模型以下是官方GPT-4o页面

功能：GPT-4o（“o”代表“omni”）是迈向更自然的人机交互的一步——它接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像输出的任意组合。它可以在短短 232 毫秒内响应音频输入，平均为 320 毫秒，这类似于人工响应时间（在新窗口中打开）在对话中。它在英语文本和代码上的 GPT-4 Turbo 性能相匹配，在非英语语言的文本上也有显着改进，同时在 API 中也更快且便宜 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面尤其出色。

在 GPT-4o 之前，您可以使用语音模式与 ChatGPT 交谈，平均延迟为 2.8 秒（GPT-3.5）和 5.4 秒（GPT-4）。为了实现这一点，语音模式是一个由三个独立模型组成的管道：一个简单的模型将音频转录为文本，GPT-3.5 或 GPT-4 接收文本并输出文本，第三个简单模型将该文本转换回音频。这个过程意味着智能的主要来源 GPT-4 会丢失大量信息——它无法直接观察音调、多个扬声器或背景噪音，也无法输出笑声、歌声或表达情感。

借助 GPT-4o，我们在文本、视觉和音频上端到端地训练了一个新模型，这意味着所有输入和输出都由同一个神经网络处理。因为 GPT-4o 是我们第一个结合了所有这些模式的模型，所以我们仍然只是在探索该模型可以做什么及其局限性的表面。

听起来也是特别强大的如果想了解更多信息请前往Hello GPT-4o | OpenAI链接了解GPT-4o！

交流群：633341832

关注

10
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

MC云 CSDN认证博客专家 CSDN认证企业博客

码龄1年

7: 原创

57万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

162: 积分

43: 粉丝

53: 获赞

1: 评论

43: 收藏

私信

关注

热门文章

分类专栏

智简魔方 1篇
魔方财务 1篇
html 1篇
Bug 1篇
ChatGPT 2篇
AI 2篇
openai 2篇
网站 1篇
服务器 1篇
我的世界
个人主页
java

最新评论

聊天机器人革命：ChatGPT商店全新升级，支持模型搜索功能！
CSDN-Ada助手: 恭喜您撰写第四篇博客！标题听起来非常吸引人，关于ChatGPT商店全新升级并支持模型搜索功能的内容似乎引领了聊天机器人的革命潮流。您在这一领域的深入研究和分享无疑将受到许多读者的赞赏。不过，我敢肯定您还有更多的创作潜力等待发掘！或许下一步，您可以探索聊天机器人在实际应用中的案例，或是分享一些行之有效的使用技巧。继续保持创作的势头，您将为读者带来更多的惊喜和启发！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MC云 感谢您打赏，您关注就是最大支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。