都在说AGI，到底什么样的AI才算AGI？

最新推荐文章于 2025-01-28 10:00:00 发布

程序员老冉

最新推荐文章于 2025-01-28 10:00:00 发布

阅读量2.2k

点赞数 27

文章标签： agi 人工智能 langchain 机器学习 transformer 面试深度学习

本文链接：https://blog.csdn.net/2301_82000445/article/details/141189770

版权

AGI，即通用人工智能（Artificial General Intelligence）。现在大家都在谈AGI，比如，很多AI公司都说要做AGI，很多人讨论AGI什么时候能实现，**但是，究竟什么样的AI才算AGI呢？**如果没有明确标准，大家各说各的，最后可能说的是完全不一样的东西。

关于AGI的标准，有很多不同的定义。例如，有人认为能通过图灵测试就是AGI，有人认为能够完成人类所有脑力任务的是AGI，有人认为要有自我意识和情感才是AGI，而OpenAI CEO Sam Altman的定义则更为夸张，他认为要能解决量子引力问题才能算AGI[1]（这可是爱因斯坦终其一生也没解决的问题）。

量子引力，是描述对引力场进行量子化的理论，主要尝试结合广义相对论与量子力学，为当前物理学尚未解决的问题

下面，介绍两个比较重要的AGI定义标准。

一、图灵测试

在早期，图灵测试被广泛用作衡量AI是否达到人类智能水平的重要标准。图灵测试的基本思想是，如果一个机器人在与人类进行文本对话时，能够让人类无法区分对方是人还是机器，那么这个机器人就被认为具有了与人类相似的智能。

2024年5月，研究显示GPT-4已通过图灵测试。在测试中，GPT-4有超过半数（54%)的机会被识别为人类，尽管这一表现和真实人类的表现（67%）还有差距，但已说明人类已经无法通过对话来有效区分对方是GPT-4还是人类了[2]。

审讯者（绿色）和证人（灰色）的一些对话。这四个证人有一个是人类，其余的是AI，你能看出哪个是人类吗？

尽管图灵测试是一项重要标准，但随着时间发展，它的局限性也日益凸显[3]：

图灵测试的核心在于检验AI系统是否具有“欺骗人类认为它是真人”的能力。这一标准更多地关注了AI在对话中的伪装技巧，而非其全面的智能水平。例如，一个AI系统可能会故意将话题引向其熟悉的领域，从而避免暴露自己在其他方面的不足。
图灵测试对被测AI的要求并不等同于对被测人类的要求。在人类之间的对话中，人类只需要展示自己真实的想法和感受即可。而AI系统则需要在对话中精心伪装自己，比如虚构自己的身份、职业、生活经历等信息，甚至需要故意表现出某些“人类特质”，如假装回答不出某些问题，以避免因为表现得过于博学而被识破。

因此，随着AI的快速发展，图灵测试已不再是一个可靠的AGI标准了。

二、DeepMind定义的标准

2023年，谷歌DeepMind提出了全新的AGI标准，该标准指出，一个真正的AGI应当从两个核心维度来考量：能力和通用性[4]。如下图所示：

能力维度：是评估AI在不同任务中表现出的技能水平。这个维度被细致地分为六个层次：

没有智能
入门（未经过专业训练的人类水平）
合格（超过50%经过专业训练的成人）
专家（超过90%经过专业训练的成人）
大师（超过99%经过专业训练的成人）
超人（超过所有人类）

通用性维度：关注AI的应用范围和适应性，按照这个维度把AI分成两种：

窄AI：能解决特定领域任务的AI
通用AI：能解决广泛的非体力任务的AI，包括学习新技能等元认知任务

以当前知名的一些AI系统为例，ChatGPT在能力维度属于入门级别，而在通用性维度属于通用AI。而AlphaFold（蛋白质折叠领域）、AlphaZero（棋类游戏领域）在能力维度属于超人级别，而在通用性维度上属于窄AI。

AlphaFold能根据DNA序列预测蛋白质折叠的三维结构，而人类大脑完全不具备这种能力

按照这个新的AGI标准来衡量，一个合格的AGI系统至少应该在能力维度上达到“合格”级别，在通用性维度上达到“通用AI”的水平。到目前为止，我们还没有看到完全符合这一标准的AI系统出现。

按照DeepMind定义的标准，以下特性并非AGI所必须具备的条件：

像大脑一样的运作机制：AGI的本质关注的是AI所能展现出的能力，而非其内部实现的具体方式。这就像飞机与鸟类的飞行能力类比一样，虽然飞机也实现了飞行，但其飞行原理与鸟类截然不同。
有意识：意识是一个深奥且充满争议的概念，在学术界至今尚未形成普遍认同的定义和标准。因此，将意识作为AGI的标准是不恰当的。AGI的核心在于其处理问题和任务的能力，而非是否具备某种主观的意识体验。
有情感：情感是人类的一个重要特征，它在我们的社交和决策中扮演着关键角色。然而，对于AGI来说，情感并不是必需的。AGI的目标是处理各种智能任务，而这并不依赖于情感的存在。一些AI社交类应用可能需要AI表现出有情感，然而，表面有情感并不意味着AI的内部需要真实的情感体验。事实上，将情感引入AI系统可能会增加AI的不可控性。
有物理行动能力：AGI关注的是AI处理脑力类任务的能力，而不是处理体力类任务的能力。因此，AGI系统可以只由计算机系统构成，而不需要包含能够执行物理动作的躯体。
在实际的工作中代替人类：使用AI来代替人类工作有多方面的考量，除了能力之外，还需要考虑成本、安全性和社会影响等因素。而在考虑AGI标准时，我们只需要看能力方面的因素。

大脑结构非常复杂，其原理至今也没有被研究明白，但AI并不需要具备和大脑一样的实现机制

DeepMind定义的标准是比较科学的，主要体现在以下几点：

揭示了智能的多维性。智能并不是像智商一样，是一个一维的数字。因此，类似 “AI 的智力相当于x岁小孩”、“AI 的智商达到了xxx”、“AI的智力会指数发展” 之类的论断，都是片面的。
实用性强。我们定义AGI的标准，并不是为了探讨哲学问题，而是为了指导我们解决现实问题。例如，AI如何推动经济发展？AI是否会导致人类大规模失业？AI是否会威胁人类生存？在这些问题中，我们更关注AI的能力，而不是AI的内部实现机制，或者AI是否具备意识等。
分等级。AGI并不是一个单一的标准，而是有不同的能力等级，这就使得它可以灵活地适应更多的使用场景。

综上所述，我认为DeepMind定义的标准是一个比较合理的AGI标准。

那么，按照这个AGI标准，什么时候可以实现AGI呢？本系列文章将继续探讨这一问题，欢迎关注。

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型？

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享

①智能客服：某科技公司员工在学习了大模型课程后，成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率，还显著降低了人工成本。
②医疗影像分析：一位医学研究人员通过学习大模型课程，掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变，为医生提供了有力的诊断辅助。
③金融风险管理：一位金融分析师利用大模型课程中学到的知识，开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险，降低了不良贷款率。
④智能推荐系统：一位电商平台的工程师在学习大模型课程后，优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率，为公司带来了显著的增长。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。