【无标题】

码农三叔

于 2024-07-26 13:17:22 发布

阅读量146

点赞数 3

分类专栏：大模型从入门到实战文章标签：人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/asd343442/article/details/140713021

版权

大模型从入门到实战专栏收录该内容

170 篇文章 54 订阅

订阅专栏

刚刚，大模型再次攻下一城！

谷歌DeepMind宣布，他们数学AI“摘得”IMO（国际数学奥林匹克竞赛）银牌，并且距离金牌仅一分之差！

是的，没有听错！就是难到绝大多数人类的奥数题。要知道今年IMO全部609名参赛者，也仅有58位达到了金牌水平。

此次，谷歌AI解决了2024 IMO竞赛6道题目中的4道，而且一做一个满分，总共获得28分。（满分42分，金牌分数线29分）

其中第四题几何题，AI仅仅用时19秒？！

而号称本届最难的第六题，今年仅有五名参赛者拿下，它也完全答对。

此次的成绩还得到了IMO组委的专业认证——由IMO金牌得主、菲尔兹奖获得者Timothy Gowers教授和两届IMO金牌得主、2024 IMO问题选择委员会主席Joseph Myers博士进行评分。

Timothy Gowers教授直接惊叹：远远超过我认知的最先进水平。

来康康是如何做到的？

谷歌拿下IMO银牌，Alpha家族新成员问世

此次拿下IMO银牌的是谷歌两位Alpha家族成员，他们各自数业有专攻。

AlphaProof，Alpha家族新成员，基于强化学习的形式数学推理系统。
AlphaGeometry 2，此前AlphaGeometry改进版，专门用于解决几何问题。

先来认识一下新成员——AlphaProof。

它是一个自训练系统，能用形式语言Lean来证明数学陈述。它能将预先训练好的语言模型与AlphaZero强化学习算法结合在一起。

团队通过微调Gemini，能自动将自然语言陈述转换为形式语言Lean陈述，由此创建了一个大型数学题库。

当遇到问题时，AlphaProof会生成解决方案候选，然后通过搜索Lean中可能的证明步骤来证明或反驳这些候选。

每个找到并验证的证明都会用于强化AlphaProof的语言模型，从而提高其解决后续更具挑战性的问题的能力。

在比赛的前几周内，它就这么循环往复地用数百万个IMO级别题目进行了训练。

比赛期间也应用了训练循环，不断强化自身证明，直到找到完整的解决方案。

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【无标题】

刚刚，大模型再次攻下一城！谷歌DeepMind宣布，他们数学AI“摘得”IMO（国际数学奥林匹克竞赛）银牌，并且距离金牌仅一分之差！是的，没有听错！就是难到绝大多数人类的奥数题。要知道今年IMO全部609名参赛者，也仅有58位达到了金牌水平。此次，谷歌AI解决了2024 IMO竞赛6道题目中的4道，而且。（满分42分，金牌分数线29分）其中第四题几何题，AI仅仅用时19秒？！而号称本届最难的第六题，今年仅有五名参赛者拿下，它也完全答对。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码农三叔 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。