OpenAI o1 模型全面评测(附国内使用o1模型方法)

此次o1发布,很多人达成的一个共识:o1模型是一个超强的理科生。

来自加州大学欧文分校(UCI)的物理学博士Kyle Kabasares,实测o1 preview+mini后发现:

o1模型已经强到,能够直出博士论文代码了! 使用方法放文末了。

2022年,物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文,探讨了利用天文数据建模来测量黑洞质量的方法。 实现这段代码是Kabasares博士研究中的一个关键突破。

o1模型在1小时内生成的Python代码。虽然基于合成数据,但其功能与Kabasares的实际代码非常相似。

efc8e2ad4e2e1ae633d35a217be462ea.png

o1在最新门萨智商测试中,IQ水平竟超过了120分。35个智商题,答对了25道,把其他模型甩出好几条街。

c461689298daae030981d65d76f95ff1.png

同时数学大神陶哲轩也分享了他对于o1模型的测评。

“他向o1模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。”而且答案是“完全令人满意的”那种。

全面测评o1模型

此次o1-preview 和 o1-mini模型最突出的能力就是数学和编程能力。我们分别进行三轮测试,数学真题、编程塔防游戏

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值