清华学霸、OpenAI姚顺雨：AI下半场开战，评估将比训练重要

AIBigModel

于 2025-04-18 16:42:10 发布

阅读量876

点赞数 22

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AIBigModel/article/details/147336040

版权

来源 | 机器之心

最近新出的《黑镜》第七季大家都看了吗？

其中第三集聚焦一个叫 ReDream 的前沿技术，允许现代演员通过 AI 和虚拟现实与经典黑白电影中的虚拟角色互动，快速重拍经典影片。随着故事发展，主角发现 AI 角色似乎拥有自我意识。

想象一下，未来的 AI 不仅能听懂你的话，还能像你一样思考、决策 —— 这正是思维树（ToT）作者、OpenAI 研究员姚顺雨正在探索的世界！

姚顺雨毕业于清华姚班，普林斯顿大学计算机科学博士，2024 年 8 月加入 OpenAI。他以语言智能体领域的开创性工作闻名：ToT 使 AI 通过多路径推理解决复杂问题，ReAct 让 AI 在推理中动态行动，CoALA 则为 AI 智能体提供了模块化的认知架构。

早在 GPT-2 刚兴起时，他就预见了语言模型的潜力，率先研究如何将其转化为「会思考的 Agent」，展现了惊人的学术前瞻性。如今，他的成果正推动 AI 在编程、教育、自动化等领域大放异彩。

近日，姚顺雨发布了一篇新博客，探讨 AI 发展的「下半场」。AI 的未来会是什么样？让我们跟随他的脚步，一起揭开人工智能的下一幕！

博客地址：https://ysymyth.github.io/The-Second-Half/

上半场

简而言之：我们正处在 AI 的中场休息时间。

几十年来，AI 主要致力于开发新的训练方法和模型，取得了显著成就，如在国际象棋和围棋中击败世界冠军，以及在多个考试中超越人类。这些成就源于基础性创新，如搜索、深度强化学习（Deep RL）和推理。

现在的不同之处在于：深度强化学习终于开始泛化，找到了一种有效的方法来解决多种 RL 任务。曾经，研究人员不相信单一方法能够应对软件工程、创意写作、复杂数学等多个领域的挑战，但如今这种情况已经改变。

接

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。