chatGPT o1 重磅发布!像人类大脑一样思考和推理!

引入 OpenAI o1-preview

一种用于解决复杂问题的新系列推理模型,将于 9 月 12 日推出。
在这里插入图片描述

OpenAI开发了一系列新的 AI 模型,这些模型在回应之前会花更多的时间思考。它们可以推理复杂的任务,比之前的模型在科学、编码和数学领域解决更难的问题。

OpenAI在 ChatGPT 和API 中发布了这个系列的第一个模型。这是一个预览版,OpenAI预计会有定期更新和改进。随着此次发布,OpenAI还包括了对下一个更新版本的评估,该版本目前正在开发中。

工作原理

OpenAI训练这些模型在回答之前花更多时间思考问题,就像人类一样。通过训练,它们学会了优化思维过程,尝试不同的策略,并识别自己的错误。
在这里插入图片描述

在OpenAI的测试中,下一次模型更新在物理、化学和生物学的挑战性基准任务中表现得类似于博士生。
在这里插入图片描述
OpenAI还发现它在数学和编程方面表现出色。在国际数学奥林匹克(IMO)预选考试中,GPT-4o 仅正确解决了 13% 的问题,而推理模型得分为 83%。它们的编码能力在竞赛中得到了评估,并在 Codeforces 竞赛中达到了第 89 百分位。您可以在OpenAI的技术研究文章中阅读更多信息。
在这里插入图片描述

作为一个早期模型,它还没有很多让 ChatGPT 实用的功能,比如浏览网络信息和上传文件和图像。在很多常见情况下,GPT-4o 在近期会更为有用。

但对于复杂推理任务来说,这是一项显著的进步,代表了 AI 能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将这个系列命名为 OpenAI o1。

安全性

作为开发这些新模型的一部分,OpenAI提出了一种新的安全培训方法,该方法利用它们的推理能力,使它们遵守安全和对齐指南。通过在上下文中推理我们的安全规则,它可以更有效地应用这些规则。

OpenAI衡量安全性的一种方法是测试当用户试图绕过安全规则时,OpenAI的模型能多好地继续遵守这些安全规则(称为 “越狱”)。在OpenAI最难的越狱测试之一中,GPT-4o 的得分是 22(在 0-100 的范围内),而OpenAI的 o1-preview 模型得分为 84。您可以在系统卡片和OpenAI的研究文章中阅读更多信息。

为了匹配这些模型的新能力,OpenAI加强了我们的安全工作、内部治理和与联邦政府的合作。这包括使用我们的准备框架进行严格的测试和评估、最好的红队测试和董事会级别的审查流程,包括安全与安保委员会的审查。

为了推进OpenAI对 AI 安全的承诺,OpenAI最近与美国和英国的 AI 安全研究所正式签署了协议。OpenAI已经开始操作这些协议,包括向这些研究所提供早期访问此模型的研究版本。这是OpenAI合作关系的重要第一步,帮助建立在模型公开发布前和发布后的研究、评估和测试流程。

适用对象

如果您正在解决科学、编码、数学及类似领域中的复杂问题,这些增强的推理能力可能特别有用。例如,o1 可以用于医疗研究人员对细胞测序数据进行注释、物理学家生成量子光学所需的复杂数学公式,以及各领域开发者构建和执行多步骤的工作流程。

OpenAI o1-mini

o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,OpenAI还发布了 OpenAI o1-mini,这是一个速度更快、成本更低的推理模型,特别适用于编码。作为一个较小的模型,o1-mini 的成本比 o1-preview 便宜 80%,使其成为需要推理但不需要广泛世界知识的应用的一个强大、经济的模型。

如何使用 OpenAI o1

从今天开始,ChatGPT Plus 和团队用户将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可以在模型选择器中手动选择,并且在启动时,o1-preview 的每周消息限制为 30 条,o1-mini 为 50 条。OpenAI正在努力提高这些限制,并使 ChatGPT 能够自动为给定的提示选择合适的模型。

一个新的 ChatGPT 下拉菜单图像,显示了在一个明亮的黄色和蓝色抽象背景上显示的新 “o1-preview” 模型选项。
从下周开始,ChatGPT Enterprise 和 Edu 用户将可以访问这两个模型。

符合 API 使用第五级资格的开发者今天可以在 API 中开始使用这两个模型进行原型设计,每分钟的限制为 20 次。OpenAI正在努力在进一步测试后提高这些限制。目前,这些模型的 API 不包括函数调用、流式传输、支持系统消息和其他功能。要开始使用,请查看 API 文档。

OpenAI还计划向所有 ChatGPT 免费用户开放 o1-mini 访问。

接下来是什么?

这是在 ChatGPT 和 API 中的这些推理模型的早期预览版。除了模型更新之外,OpenAI还预计将添加浏览、文件和图像上传等功能,使其对所有人更有用。
在这里插入图片描述
在这里插入图片描述

OpenAI还计划继续开发和发布 GPT 系列模型,除了新的 OpenAI o1 系列外。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大嘤三喵军团

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值