OpenAI o1模型怎么使用,这篇文章告诉你

九月最大的热点无疑就是OpenAI推出o1模型 此次发布的o1 系列模型就是之前内部代码为“草莓”模型。

下面就给大家介绍一下此次o1模型的强大之处以及使用方法。

如果大家想要了解OpenAI o1方法,可直接拉到文章末尾。

1.、博士级学科能力

o1模型在推理能力上展现出了前所未有的提升。与当前主力模型GPT-4o相比,o1预览版在解决数学、编程及博士级别科学题目上的能力提升了5-6倍,而全功能的o1模型则实现了8-9倍的提升,甚至超越了人类专家的平均表现。

在博士级科学问题的 GPQA Diamond 评测中,GPT4o 的正确率为 56.1%,人类专家则为 69.7%,而 o1 则显著提升至 78%。

此外,o1 模型在机器学习基准测试、理化生等各科考试以及化学与生物领域的博士级科学问题上,均明显优于 GPT-4o。更是超越了人类专家,成为首个在 GPQA diamond 基准上击败人类专家的 AI 模型。

2、o1模型的限制

这么厉害的模型,自然不便宜 o1预览版每周只能发30条信息,o1-mini每周发50条信息。 对于 API 用户,o1预览版每百万输入15美元,每百万输出60美元。

o1-mini则会便宜一些,每百万输入3美元,每百万输出12美元。

不过,大家可注意啦,这里的输出token可不是按照o1模型的最终输出,其中间思考过程所消耗的 token,并被视作 output tokens,这意味着 100 tokens 的内容输出,可能会被按 10000 tokens 计费。

3、o1模型的实际咋样

数学界的泰斗陶哲轩教授,在Mastodon平台上分享了他的试用体验。他向o1模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理(满血o1模型)。 陶哲轩还做了一些其它测试,他的体验感受:

比以前的模型更牛,多写点提示词表现还不错,但仍然会犯不小的错误,也没有产生啥自己的思想。 就像给一个平庸无奇但又有点小能力的研究生提供建议。

不过如果有计算机代数包和证明辅助工具啥的,对其进行改进,还能再一次升级,相应的能力会提升不少。

而在编程上,另外因为大佬也做了测试,测试结果:编程真的也非常很厉害。

在2022年,物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文,探讨了利用天文数据建模来测量黑洞质量的方法。 实现这段代码是Kabasares博士研究中的一个关键突破。

然后o1模型在1小时内生成的Python代码。虽然基于合成数据,但其功能与Kabasares的实际代码非常相似。 诚然,现在o1模型的实力已经断崖式领先,不仅在数学,推理这些大大模型难以突破的领域取得卓越的成绩。更是在基准测试上也碾压一众大模型,表现的十分亮眼。 现在o1模型已经在ChatGPT Plus上可以使用了,大家可以去体验一下~

4、国内可用OpenAI o1方法

国内有许多镜像中转站,大家可以去自行探索。

这里就大家介绍的是2233.ai这个网站,可以使用最新版的o1-preview和o1mini模型,还可以任意使用ChatGPT4o模型。

不仅如此,还能使用GPTs,Dallas-E多模态绘画功能。甚至还能于ChatGPT语音通话。 还有大家最关心的一点,无需科学上网即可使用。

OpenAI的o1模型在推理、数学、编程等领域表现优异,远超现有模型甚至人类专家。然而,尽管其能力突出,使用成本较高且存在一些限制。实际体验中,o1模型虽然表现出色,但仍有改进空间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值