OpenAI o1 模型全面评测(附国内使用o1模型方法)

此次o1发布,很多人达成的一个共识:o1模型是一个超强的理科生。

来自加州大学欧文分校(UCI)的物理学博士Kyle Kabasares,实测o1 preview+mini后发现:

o1模型已经强到,能够直出博士论文代码了! 使用方法放文末了。

2022年,物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文,探讨了利用天文数据建模来测量黑洞质量的方法。 实现这段代码是Kabasares博士研究中的一个关键突破。

o1模型在1小时内生成的Python代码。虽然基于合成数据,但其功能与Kabasares的实际代码非常相似。

o1在最新门萨智商测试中,IQ水平竟超过了120分。35个智商题,答对了25道,把其他模型甩出好几条街。

同时数学大神陶哲轩也分享了他对于o1模型的测评。

“他向o1模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。”而且答案是“完全令人满意的”那种。

全面测评o1模型

此次o1-preview 和 o1-mini模型最突出的能力就是数学和编程能力。我们分别进行三轮测试,数学真题、编程塔防游戏、经典疑难杂症题。 首先将数学竞赛的真题发给它,思考56秒后就给出正确答案。

同时,我们让它做一个塔防游戏,o1-mini也能给出相应的意见。

不过9.11和9.8依旧分不出谁更大,而且连续两次都回答错误。不过可以区分出“Strawberry“有多少个r了。

总的来说,此次OpenAI推出的o1-preview 和 o1-mini模型整体表现很强,大家有条件的可以去尝试一下,不过注意使用次数。o1 预览版目前每周限量提供30条,o1-mini 每周限量提供50条。

国内可用OpenAI o1方法

这里给大家推荐2233.ai这个工具。也可以体验最新版的 o1-preview 和 o1-mini 模型,像是之前的 GPT4o 的语音通话功能、绘画功能、上传文件功能、对话功能。ChatGPT所具有的功能这里全都有。

我使用了这么长时间,确实就原生版本体验。

最后真的先说一下,o1模型的发布代表这大模型迈向了新的台阶,如果有人工智能的奥斯卡奖,那么o1模型一定能获得这次的奖项。

它不仅仅是一个模型,是技术的巅峰,真的不敢想象把最新的o1模型放到机器人上会是一副什么样的场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值