2024最新最全AGI发展综述

最新推荐文章于 2025-01-17 22:06:23 发布

编程瞬息全宇宙

最新推荐文章于 2025-01-17 22:06:23 发布

阅读量1.4k

点赞数 16

文章标签： agi

本文链接：https://blog.csdn.net/wholeliubei/article/details/141892245

版权

在这里插入图片描述

作者 / “How far are we from AGI” 论文团队 **创作声明/**欢迎转载，请标记arxiv和github链接，本文投稿各大公众号

在刚刚结束的 ICLR 2024 workshop上全场座无虚席，大家都对一个话题感兴趣“我们距离 AGI还有多远”。在场图灵奖教授Yoshua Bengio, 以及Choi Yejin, Song Han等著名学者深入探讨了AGI的相关话题，包括了“我们如何更好定义AGI”, “如何跟安全有效地到达AGI”,“实现AGI的目前主要障碍”。

图一：AI不断超越人类的领域比例（估算）以及关键工作

随着OpenAI最新发布的GPT-4o和Google I/O大会的突破性进展，AGI的发展又往前进了一步。我们正处在一个前所未有的转折点，AGI的曙光已经隐约可见。尽管现有文献从不同角度对AGI进行了研究，但往往缺乏对其发展轨迹的全面评估和对目标的精确定义，这使得从当代AI到AGI的过渡，以及AGI往更深层级的发展变得模糊不清。

作者认为，现在比以往任何时候都更需要全面探讨AGI。这个时代正在呼唤新的思维方式和突破性技术，我们正站在一个即将迎来智能革命的风口浪尖。AGI时代即将到来，未来的无限可能性正等待着我们去探索与实现。

论文链接：https://arxiv.org/pdf/2405.10313
Github链接：GitHub - ulab-uiuc/AGI-survey

本文中，来自UIUC的团队对最近的AGI发展展开了全面调研，并着眼于AGI技术的五大方面：内在能力、外在接口、系统、安全对齐，以及AGI的评估和实现。这篇论文深入探讨了“人类离通用人工智能(AGI)还有多远”,以及“如何更加安全地通往AGI？”这两个关键问题。

图二：文章整体架构，AGI实现的基础以及安全地在各个领域中体现

AGI组件:包括AGI内部能力、AGI接口和AGI系统三个方面。其中,AGI内部涉及感知、推理、元认知和记忆;AGI接口连接数字世界和物理世界,并涉及其他智能体和人类的交互;AGI系统则包含架构、算法、成本/效率和平台等内容。
AGI对齐技术:作为连接AGI组件与负责任AGI方法的桥梁,对齐技术确保了AGI的发展能够契合人类的价值观和需求。
负责任地实现AGI的方法:包含了AGI发展的各个层次、应对AGI挑战的策略、对AGI现状和发展的评估,以及可能的解决方案。
案例研究:从科学发现、生成式视觉智能、世界模型、去中心化LLMs、AI编程、AI机器人和人机协作等方面,提供了AI技术在现实场景中应用的案例分析。

图三：AGI的内在能力，包括感知、推理、记忆和元认知能力

文章的第二章着重介绍了AGI内部的演进。AGI内部应作为一个有机整体，各个模块之间持续互动，并为AGI与外部的交互提供支持。每个模块在未来的研究可以关注以下方面。

感知 (Perception): 增强多模态的感知和融合，发展出像人一样的认知感知

推理 (Reasoning): 努力实现稳健、易懂、高效、长期视角的推理，全面优化预训练、微调和策略提示阶段的推理能力

记忆 (Memory): 高效管理和利用不同层次的记忆，整合检索与推理，使知识和经验能自动更新

元认知 (Metacognition): 专注于最少外部指导下的自我进化和元学习，提升认知能力，强调自我意识的潜力，并考虑伦理影响

图四：AGI与外部世界的接口，能顺利和数字世界，物理世界以及与其他智能进行交互

作者接着讨论了 AGI(通用人工智能)接口的演进。它分为三个主要的接口类别:

数字接口:

当前状态:网页界面、代码解释器、API等场景

未来:数字接口将从网页过渡到代码解释器,然后到 API。最终,AGI 发明的工具将会出现。

物理接口:

当前状态:用于物理交互的机械臂、各种类型传感器

未来:物理接口将进步到包括声音感知输入、视觉感知输入、商用机器人,并最终实现更精确的机器人控制。

智能接口:

当前状态:与人类交互、与智能体交互

未来:智能接口将演变为与软件智能体的通信,导致安全性和一致性的提高,以及智能体网络的形成。

图五：关于目前AI的系统讨论

文章的第四章着重介绍了AGI系统相关的内容，从大语言模型的切入点介绍了包含了多个角度的内容工作：

**模型架构层面：**自注意力机制的技巧，模型参数压缩，内核算子优化，以及一些区别于现在主流Transformer的架构介绍
**模型训练：**高性能计算框架，内存/显存管理系统，下游任务微调模型技巧，去中心化大语言模型系统，和大模型的训练机制以及实验性的研究工作
**模型推理：**Decoding算法，消息请求的调度算法，以及多模型的部署技巧
**效率与能耗：**介绍了关于“数据经济学”的理论和算法，模型融合，以及自动化深度学习和大模型的系统工作
**计算平台：**计算成本，加速器的迭代更替，以及新的硬件所带来的机会与算法的联系

并且在结尾基于现有介绍的工作的优势与局限性，结合着AI发展趋势与用户需求，提出了一些对于AGI系统能力以及模式的畅想以及一些热点方向的可能性：如何训练千亿参数模型？如何同时部署超过一千个不同的LoRA Heads？如何有效的整合分散的计算资源（新的训练模式）？下一代的AGI系统所提供的服务类型等。

图六：理想的AGI系统架构

文章的第五章深入探讨了AGI对齐技术，着眼于如何利用AGI的能力以适应生产和日常生活中的实际应用。具体内容如下：

1当前对齐技术：

分析了在线人类监督、离线人类监督以及交互式监督三种主要的AGI对齐方法。这些方法各有特点，旨在确保AGI系统的行为与人类利益保持一致。

2 AGI的期望与能力：

从AGI的内部能力、界面以及系统整体进行了详细介绍，同时强调了与AGI相关的伦理问题，如公平、安全、隐私、信任和透明度。

3 未来对齐策略：

探讨了基于参与者和基于交互的两种潜在AGI对齐路径。其中，基于参与者的对齐侧重于AGI与工具、代理和人类的互动；而基于交互的对齐则强调简单互动、约束以及超人类智能的整合。

4 伦理与技术的补充：

深入探讨了技术发展应如何与伦理标准相结合，以确保AGI系统的发展既符合技术进步的要求，也符合社会的伦理期望。

5 综合讨论与未来展望：

在综合现有研究的基础上，结合AI发展的趋势与用户需求，本章提出了对AGI系统能力及其应用模式的未来畅想，指出了当前研究的优势与局限性，并探讨了未来的发展方向。

本章不仅阐述了AGI对齐技术的现状和挑战，还展望了这一领域未来可能的发展路径，旨在推动AGI技术的实际应用与伦理发展步伐相协调。

图七：AGI对齐方法框架

AGI 分类机制

文章首次比较清晰地定义了AGI的三个发展等级:

**第一级(初始AGI)😗*代表当前最先进的AI系统,如GPT-4。这些系统在广泛的任务中表现出色,能够理解自然语言、生成连贯且符合上下文的响应,并执行复杂的推理。但它们的性能仍然局限于特定领域,可能无法在所有任务中始终超越人类水平。

**第二级(超人AGI)😗*在这一级别,AGI系统在多个领域和任务中展现出优于人类的性能,无论是在效率、可靠性还是创新能力方面都有突出表现。它们能够从有限的数据中学习,跨领域泛化知识,并在最小人工干预的情况下适应新环境。

**第三级(终极AGI)😗*作为AGI发展的巅峰,这一级别代表理想化的AI系统。终极AGI将拥有远超人类的学习、推理和决策能力,同时与人类的价值观和目标保持高度一致。不过,实现终极AGI仍是一个理论概念,其可行性有待持续研究和讨论。

、

图八：AGI三个等级以及人类水平

上面地雷达图形象地描述了三个等级在不同维度上的能力区别以及和人的能力的比较，下表更加详细的就不同等级所具备或者不具备的特征予以说明：

随后第六章还探讨了AGI合适的评估体系，文章概述了 AI 系统评估的发展历程和现状,指出理想的 AGI 评估框架应具备全面性、公平性和效率等特点。作者讨论了现有评估方法的局限性,如过度依赖数值指标、替代指标、缺乏失败分析以及缺乏更通用的任务等,为未来 AGI 评估框架的发展提供了思路。

图十：AI研究者对于AGI到来时间的预估

随后作者总结了Yoshua Bengio, Choi Yejin等人在workshop现场表达的主要观点以及在研讨会上讨论或者作者认为重要的通往AGI的一些关键问题，例如“目前的通往AGI的主要障碍是什么？”，“目前自回归生成模型还能走多远”以及“研究者们对AGI到来时间的预估”。

在文章的结尾，作者对目前AI领域的多个热门方向展开了深入分析，例如AI科学发现、视觉生成模型、人机合作等。通过细分的实例研究，全面展示了AI在近些年的爆炸式增长及其对人类生活各个方面的深远影响。

AGI时代的到来不再只是梦想，它正在逐步成为现实。未来的无限可能性正等待着我们去探索与实现，而这份综述将成为引导我们前行的指南。

人工智能大模型如何入坑？

想要完全了解大模型，你首先要了解市面上的LLM大模型现状，学习Python语言、Prompt提示工程，然后深入理解Function Calling、RAG、LangChain 、Agents等

很多人不知道想要自学大模型，要按什么路线学？

所有大模型最新最全的资源，包括【学习路线图】、【配套自学视频+pdf】、【面试题】这边我都帮大家整理好了通过下方卡片获取哦！

《人工智能\大模型入门学习大礼包》，可以扫描下方二维码免费领取！

在这里插入图片描述

1.成长路线图&学习规划
要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。
对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。
在这里插入图片描述

2.视频教程
很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，其中一共有21个章节，每个章节都是当前板块的精华浓缩。

在这里插入图片描述

3.LLM
大家最喜欢也是最关心的LLM（大语言模型）

在这里插入图片描述

发展前景：大模型在自然语言处理、图像识别、语音识别等领域具有广泛的应用。随着大数据时代的到来，大模型技术将继续发展，为程序员提供更多的发展机会。

技能要求：要成为一名优秀的大模型程序员，需要具备以下技能：

掌握深度学习相关知识，如神经网络、卷积神经网络等；
熟悉编程语言，如Python、C++等；
了解大数据处理技术，如Hadoop、Spark等；
具备良好的数学和统计学基础，以便更好地理解和优化大模型。