自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真

对话中,它可以听懂用户说话时不同的语调、语气,还能根据自己的台词生成不同语气的语音,完全没有「机械感」。下一个任务,另一位研发负责人Barret手写了一个方程,并打开摄像头拍给ChatGPT,让它扮演「在线导师」的角色帮助自己解题,而且只能给提示,不能直接说答案。并且,GPT-4o不仅提供与GPT-4同等程度的模型能力,推理速度还更快,还能提供同时理解文本、图像、音频等内容的多模态能力。而且,模型能够理解人类在对话中适时「打断」的习惯,会及时停下来听你说话,并给出相应的回复,而且也不会「断片」。

2024-05-24 17:31:43 782

原创 当 GPT-4o 遇上 ChatGPT-4:功能与应用的全面解析

4. 性能提升:在传统基准测试中,GPT-4o 在文本、推理和代码智能方面达到了 GPT-4 Turbo 级的性能,同时在多语言、音频和视觉能力方面达到了新高度。1. 多模态理解与生成:GPT-4o 可以对音频、视觉和文本进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。4. 性能表现:GPT-4o 在多语言、音频和视觉能力方面有了显著提升,在传统基准测试中,其在文本、推理和代码智能方面达到了 GPT-4 Turbo 级的性能。

2024-05-23 15:10:17 2184

原创 微软掀起生产力革命!GPT-4o 重塑 Windows,奥特曼新模型剧透登场

在发布会即将结束时,Sam Altman 突然登场,与微软 CTO Kevin Scott 探讨了关于 AI 和开发者的关系,也谈论了最近发布的 GPT-4o,并预告下一个大模型即将面世,微软为此也准备了一台规模更大的超级计算机。正如浏览器可以看做互联网与人连接的「接口」,Copilot 也在成为 AI 与人连接的「接口」。然而,看看人们用 GPT-4 所做的事情,以及现在 GPT-4o 的应用情况,尽管它还很新,还没推出多久,但我从未见过一项技术在如此短的时间内以如此有意义的方式被如此迅速地采用。

2024-05-22 14:52:32 1733

原创 OpenAI 发布会彩蛋

GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,这类似于人类响应时间。在对话中。它在英语文本和代码上的 GPT-4 Turbo 性能相匹配,在非英语语言的文本上也有显着改进,同时在 API 中也更快且便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

2024-05-15 16:31:07 785 1

原创 GPT-4o十项能力最新测评

这次 GPT-4 turbo GPT-4o的十项能力分别是。

2024-05-15 16:20:50 2010

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除