OpenAI o1模型怎么使用，这篇文章告诉你

小飞豚说AI

已于 2024-09-24 10:41:18 修改

阅读量995

点赞数 18

文章标签： AIGC ai 人工智能

于 2024-09-24 10:25:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaofeitunAI/article/details/142482585

版权

九月最大的热点无疑就是OpenAI推出o1模型此次发布的o1 系列模型就是之前内部代码为“草莓”模型。

下面就给大家介绍一下此次o1模型的强大之处以及使用方法。

如果大家想要了解OpenAI o1方法，可直接拉到文章末尾。

1.、博士级学科能力

o1模型在推理能力上展现出了前所未有的提升。与当前主力模型GPT-4o相比，o1预览版在解决数学、编程及博士级别科学题目上的能力提升了5-6倍，而全功能的o1模型则实现了8-9倍的提升，甚至超越了人类专家的平均表现。

在博士级科学问题的 GPQA Diamond 评测中，GPT4o 的正确率为 56.1%，人类专家则为 69.7%，而 o1 则显著提升至 78%。

此外，o1 模型在机器学习基准测试、理化生等各科考试以及化学与生物领域的博士级科学问题上，均明显优于 GPT-4o。更是超越了人类专家，成为首个在 GPQA diamond 基准上击败人类专家的 AI 模型。

2、o1模型的限制

这么厉害的模型，自然不便宜 o1预览版每周只能发30条信息，o1-mini每周发50条信息。对于 API 用户，o1预览版每百万输入15美元，每百万输出60美元。

o1-mini则会便宜一些，每百万输入3美元，每百万输出12美元。

不过，大家可注意啦，这里的输出token可不是按照o1模型的最终输出，其中间思考过程所消耗的 token，并被视作 output tokens，这意味着 100 tokens 的内容输出，可能会被按 10000 tokens 计费。

3、o1模型的实际咋样

数学界的泰斗陶哲轩教授，在Mastodon平台上分享了他的试用体验。他向o1模型提出一个措辞模糊的数学问题，发现它竟然能成功识别出克莱姆定理（满血o1模型）。陶哲轩还做了一些其它测试，他的体验感受：

比以前的模型更牛，多写点提示词表现还不错，但仍然会犯不小的错误，也没有产生啥自己的思想。就像给一个平庸无奇但又有点小能力的研究生提供建议。

不过如果有计算机代数包和证明辅助工具啥的，对其进行改进，还能再一次升级，相应的能力会提升不少。

而在编程上，另外因为大佬也做了测试，测试结果：编程真的也非常很厉害。

在2022年，物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文，探讨了利用天文数据建模来测量黑洞质量的方法。实现这段代码是Kabasares博士研究中的一个关键突破。

然后o1模型在1小时内生成的Python代码。虽然基于合成数据，但其功能与Kabasares的实际代码非常相似。诚然，现在o1模型的实力已经断崖式领先，不仅在数学，推理这些大大模型难以突破的领域取得卓越的成绩。更是在基准测试上也碾压一众大模型，表现的十分亮眼。现在o1模型已经在ChatGPT Plus上可以使用了，大家可以去体验一下~

4、国内可用OpenAI o1方法

国内有许多镜像中转站，大家可以去自行探索。

这里就大家介绍的是2233.ai这个网站，可以使用最新版的o1-preview和o1mini模型，还可以任意使用ChatGPT4o模型。

不仅如此，还能使用GPTs,Dallas-E多模态绘画功能。甚至还能于ChatGPT语音通话。还有大家最关心的一点，无需科学上网即可使用。

OpenAI的o1模型在推理、数学、编程等领域表现优异，远超现有模型甚至人类专家。然而，尽管其能力突出，使用成本较高且存在一些限制。实际体验中，o1模型虽然表现出色，但仍有改进空间。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。