OpenAI o1 模型全面评测（附国内使用o1模型方法）

小飞豚说AI

已于 2024-11-19 10:39:28 修改

阅读量1.6k

点赞数 11

文章标签：人工智能

于 2024-09-27 02:13:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaofeitunAI/article/details/142581495

版权

此次o1发布，很多人达成的一个共识：o1模型是一个超强的理科生。

来自加州大学欧文分校（UCI）的物理学博士Kyle Kabasares，实测o1 preview+mini后发现：

o1模型已经强到，能够直出博士论文代码了！使用方法放文末了。

2022年，物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文，探讨了利用天文数据建模来测量黑洞质量的方法。实现这段代码是Kabasares博士研究中的一个关键突破。

o1模型在1小时内生成的Python代码。虽然基于合成数据，但其功能与Kabasares的实际代码非常相似。

o1在最新门萨智商测试中，IQ水平竟超过了120分。35个智商题，答对了25道，把其他模型甩出好几条街。

同时数学大神陶哲轩也分享了他对于o1模型的测评。

“他向o1模型提出一个措辞模糊的数学问题，发现它竟然能成功识别出克莱姆定理。”而且答案是“完全令人满意的”那种。

全面测评o1模型

此次o1-preview 和 o1-mini模型最突出的能力就是数学和编程能力。我们分别进行三轮测试，数学真题、编程塔防游戏

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。