融合RL与LLM思想 · 探寻世界模型迈向AGI「上中下合订本PDF下载」

首先,非常感谢很多微信公众号的独立个人和机构运营者,在文章在微信公众号上发布之初在阅读到文章后能够转载分享其中的内容,让更多的AI爱好者能够看到!

其中也有很多专业人士提出了相关在技术上、内容形式上的诸多宝贵建议和指正,在此也对来自不同领域读者的鼓励和认可表示感谢!

为了方便各位读者阅读,将这一内容合订整理成册,供大伙使用,也非常欢迎我们一起随时探讨沟通:

关于 融合RL与LLM思想 · 探寻世界模型迈向AGI「上中下合订本V4版本」大家可访问下载: 

 链接: https://pan.baidu.com/s/1evSX258tJ9wvA0GAULj8Fw?pwd=lm51 提取码: lm51 

也可扫码直接下载:

「写作前的初衷」

本篇文章于2023年底2024年初春节假期期间撰写,处于当前从事的工作以及浓厚的个人兴趣,在看到过去一段时间人工智能技术的快速发展,通过自己的思考并尝试挖掘探寻以ChatGPT为代表的LLMs和以AlphaGO/AlphaZero及当下AlphaDev为代表的Alpha系列之间的AR和RL思想的背后底层理论及形式上的统一,同时基于去年OpenAI暴露出的project Q*可能的关于推理过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考,以尝试展望和探索当下面向未来AGI路径可行性以及背后的一些理论基础...正如前几日AI一姐李飞飞教授所说,人工智能即将迎来它的「牛顿时刻」...

同时,因为文章内容整体比较冗长,给大家造成一定的阅读困扰,但仍希望大家能够阅读下去并且希望能够在大家今后的工作与学习中提供一种回顾性参考,内容上尽量采用简单通俗的表述,其中文章囊括了诸如强化学习「RL」、自回归「AR」大语言模型「 LLMs」等技术领域深刻内涵思考,穿插关联了丰富的计算机科学/数学/物理学/哲学/心理学等领域跨学科内容,回顾了人工智能近现代发展历史,并在部分章节中以作者视角回顾总结过去一年中大模型给自己带来的思想冲击...大家如有疑问困惑和不同看法也非常欢迎评论指正或直接如流探讨,感谢!

「写作后的感想」

在写完这篇文章外加最近外界的诸多新闻,似乎更坚定了我对AGI实现的确定性,因此回到我最初想要写这篇文章前其中的一个分非常重要的目的同时也非常迫切的希望我们需尽快完善AI进行综合安全监管和治理上的考虑,正如Hitton的担忧与后悔:自己正在成为下一个曼哈顿计划的始作俑者,包括我们每一个人,包括我自己。
不管未来的AGI的实现路径是基于LLMs自回归一直暴力scaling prediction下去,还是沿着LeCun的世界模型路径慢思考的摸索前进,还是在即将到来的下几代GPT中出现了真正令人惊呼的Q-star,亦或sora在Diffusion的路途中无限逼近并涌现出对世界规律的精确模拟,我想不管人类最终探索出上述通往AGI路途中的哪种路径,采用那种模型结构,运用哪些数学变换方法,还是最终找到了创造无限的数据构象分布并建立全域pattern的可能的理论基础,最终回归第一性原理的思考,在这个世界中推理认知的模式和对人类产生的影响的本质方面,我想都是值得我们每一位伙伴们深思并做出正确的人类发展历程中的决定。

在此特别感谢以下独立个人和机构公众号运营者的热情转载和分享」:

「深度图学习与大模型LLM」·「AINLP」·「JioNLP」·「土猛的员外」·「猫的洞见」·「AI趣谈」·「知识工场」·「智药邦」·「Tim在路上」·「写代码的中年人」·「CreateAMind」··技术狂潮AI」·「芝士AI吃鱼」·「扬奇智能社区」·「智能探索客」·「EDPJ」·「AIRoobt」·「AIGC最前线」·「AI生成未来」·「思源数据科学」·「SuuJiKat」·「跨模态 AGI」·「CVer新视觉」·「大数据开发与机器学习」·「AIGC新知」·「图机器学习与大语言」·「机器学习与基础数学」·「 机器学习与人工智能」·「 星火之光AI」·「 人工智能前沿讲习」·「 未来坐标」·「 AIWalker」·「 AGI之家」·「 数据派THU」..

 

 

 

  • 43
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值