一文带你快速了解GPT 最新模型 o1!国内直接使用 !

一、GPT-o1简介

北京时间9月13日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题,OpenAI 发布最强模型 o1 !o1系列分包含三款模型,OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。

OpenAI o1:高级推理模型,暂不对外开放。

OpenAI o1-preview:这个版本更注重深度推理处理,每周可以使用30次。

OpenAI o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。

为什么取名叫o1,官方原文如下:

For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.

翻译过来是:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。

OpenAI 将计数器重置为 1,并将其命名为 OpenAI o1,强调其与传统 GPT 系列相比,更注重推理。这标志着一个新的 OpenAI o 系列的开始,类似于我们所熟知的 GPT 系列。

此外,o1 标志着大型学习模型(LLMs)训练方法的转变,更加强调在训练和推理阶段投入计算资源。

o1 模型并不是在所有情况下都旨在取代 GPT-4o。对于需要图像输入、函数调用或一致快速响应时间的应用,GPT-4o 和 GPT-4o mini 模型仍然是最佳选择。

二、OpenAI o1 如何工作

当您与 o1 交互时,首先会注意到的是,与 GPT-4o 相比,它生成响应的时间明显更长。这种故意的暂停反映了模型对推理的强调。o1在响应之前花费更多的时间“思考”,允许它处理复杂的任务并在逻辑、数学、编程和科学中解决更难的问题。

o1所花费的长反应时间,我们可以理解为类似人类的“深思熟虑”。可以发现随着训练时间(强化学习的增加)和思考时间(测试时的计算)的延长,o1模型的表现逐渐提升。

拟人化的推理模式是o1的主打功能之一,与传统模型不同,它在回答问题之前会进行深入的思考,生成一个较长的内部思维链。这种思维链的产生使得 o1 能够更好地理解问题的本质,分析问题的各个方面,从而给出更准确和合理的答案。

三、与GPT4o相比GPTo1有什么特点?

o1系列在推理测试中的表现足以吊打所有现有的AI大模型,在处理物理、化学和生物等需要强推理的理科问题时,o1的表现甚至和该领域的博士生水平不相上下。

AIME 2024,一个高水平的数学竞赛,GPT4o准确率为13.4%,而这次的o1预览版,是56.7%,还未发布的o1正式版,是83.3%。

代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版,是89%。

博士级科学问题 (GPQA Diamond),GPT4o是56.1,人类专家水平是69.7,o1达到了恐怖的78%

与 OpenAI o1 相比的主要 AI 模型
GPT-4o:GPT-4o 是一种更通用的模型,非常适合一般的日常对话和文本生成。它也比 o1 型号更实惠,并且响应时间更快。但OpenAI o1在推理能力和解决复杂问题方面更胜一筹。
Claude(Anthropic 的 AI):Claude 被设计为一个有道德的 AI,特别关注安全。定价相对合理,响应速度快,但不具备OpenAI o1的复杂问题解决能力。虽然相比o1更具成本效益,但OpenAI o1对于复杂的推理任务具有优势。
Google Bard:Google Bard 非常适合信息搜索和网页浏览,特别是在基于实时信息进行响应时。至于定价,它通常是免费的,但 OpenAI o1 更擅长解决复杂的数学和科学问题。
下面是OpenAI新模型o1和GPT-4o的性能对比。结果分为四类。

这种强大的推理能力无疑是现有的AI大模型所缺乏的,但o1的出现打破了这一现状。

也就是说,o1在科学、数学和编程领域都有强大的潜力,能够帮我们解决更多的实际问题,而不只是像以往一样仅能用于写作绘画音乐等文艺领域。

四、怎么使用GPT-o1

目前,ChatGPT Plus和Team用户可以体验o1-preview和 o1-mini 等模型。可以从 ChatGPT 的“模型选择器”中选择模型。API用户中,只有花费超过1000美元的“大佬“们才能优先体验。(升级plus含国内镜像详细教程:升级PLUS

目前,o1-preview每周限30条消息,“迷你版“o1-mini,每周可用50次。使用次数比较少,OpenAI 表示正在努力提升用户的可使用次数,并让 ChatGPT 能自动针对给定提示词选择使用合适的模型。此外,o1还不能浏览网页或处理图片,所以有些日常任务还是得靠我们的老朋友GPT-4o~(下图是国内镜像网站,不是套盒网站:了解更多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值