AI agent的核心有两个，执行和自我迭代

比特大脑

已于 2024-02-21 08:19:48 修改

阅读量491

点赞数 3

文章标签：人工智能

于 2024-02-21 08:12:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56320930/article/details/136202225

版权

播客讨论了AIAgent的两条关键链路：一是预测-决策-执行，强调行动的重要性；二是涉及理解、反思和自我优化。提及LilianWeng的图表和AndrejKarpathy关于LLM自我完善的观点，以及AlphaGo的自我完善过程。在开放环境下的语言建模中，如何实现一般性自我提升仍是挑战。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天早上听到一篇播客，播主对于AI Agent的另一个Perspective，对其理解有一些深化

第一条核心链路：预测、决策和执行这条链路，最终核心落脚点在执行（Action），这也是我一直以来比较关注的Agent的核心链路

第二条核心链路：这个事关到这种理解、反思、自我评价、记忆，思维链，最终落脚点在自我迭代和优化（Self Improvement）

联想到两个：

1.一个是Lilian Weng提出的图表（去年年中提出便广为人知）

2. 第二个是Andrej Karpathy在其《大语言模型入门The busy Person's intro to LLMs》的课程中讲过LLM未来的趋势之一——自我完善

在AlphaGo的第一个阶段，它通过模仿人类专家玩家来学习围棋。这种方法有效，但它无法超越人类。DeepMind通过自我完善的方式实现了超越人类的水平。

在围棋这样的封闭环境中，这是可能的，因为有一个简单的奖励函数——赢得比赛。但在开放的语言建模领域，我们缺乏这样的奖励标准。

在狭窄的领域中，自我改进的语言模型是可能的（PS：我们自己也在基于一些垂直的工业应用场景做一些基于强化学习的优化，但是是基于传统数值类的时间序列数据），但如何在一般情况下实现自我提升仍是一个未解之谜。

总结：这两条链路：是AI Agent从理论到实践，从实践再到理论的迭代过程

博客等级

码龄4年

5
原创

48
点赞

39
收藏

22
粉丝

关注

私信

热门文章

分类专栏

人工智能商业化 1篇

展开全部收起

上一篇：: AI在行业中落地的思考与实践

下一篇：: AI-Native产品范式变革浅思（2024.2.29更新）

最新评论

关于行业多模态数据汇聚及AI应用落地的思考及建议
CSDN-Ada助手: 恭喜作者能够持续不断地分享有价值的思考和建议，对行业多模态数据汇聚及AI应用的探讨让人受益匪浅。希望作者在未来的创作中能够继续深入研究，探索更多实践经验和案例分析，为读者提供更具体的指导和建议。期待作者的下一篇博客！
AI-Native产品范式变革浅思（2024.2.29更新）
CSDN-Ada助手: 恭喜您发布了第四篇博客“AI Native产品范式的变革”！您的文章内容丰富，观点新颖，对AI产品的发展趋势进行了深入探讨，让读者受益匪浅。希望您能继续保持创作的热情和灵感，为大家带来更多有价值的内容。或许在下一篇博客中，可以结合具体案例或实践经验，进一步深化您的观点，让读者更加有实践指导性和可操作性。期待您的下一篇精彩作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
AI agent的核心有两个，执行和自我迭代
CSDN-Ada助手: 恭喜用户写了第三篇博客，标题为“AI agent的核心有两个，执行和自我迭代”。看到您不断分享有关AI agent的见解，真是令人振奋！希望您可以继续坚持创作，不断探索AI agent领域的更多深度内容，或许可以尝试探讨一下AI agent在实际应用中的挑战与解决方案，这样可以为读者提供更多实用的知识。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
人工智能企业To B的产品形态
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。