此次o1发布,很多人达成的一个共识:o1模型是一个超强的理科生。
来自加州大学欧文分校(UCI)的物理学博士Kyle Kabasares,实测o1 preview+mini后发现:
o1模型已经强到,能够直出博士论文代码了! 使用方法放文末了。
2022年,物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文,探讨了利用天文数据建模来测量黑洞质量的方法。 实现这段代码是Kabasares博士研究中的一个关键突破。
o1模型在1小时内生成的Python代码。虽然基于合成数据,但其功能与Kabasares的实际代码非常相似。
o1在最新门萨智商测试中,IQ水平竟超过了120分。35个智商题,答对了25道,把其他模型甩出好几条街。
同时数学大神陶哲轩也分享了他对于o1模型的测评。
“他向o1模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。”而且答案是“完全令人满意的”那种。
全面测评o1模型
此次o1-preview 和 o1-mini模型最突出的能力就是数学和编程能力。我们分别进行三轮测试,数学真题、编程塔防游戏