近年来,检索增强生成(RAG)技术在AI领域掀起了一股热潮,被许多人视为大语言模型(LLM)发展的未来方向。然而,斯坦福大学最近发表的一项研究结果让我们不得不重新思考这个问题。这项研究不仅量化了RAG的效果,也揭示了其潜在的局限性。让我们深入探讨这个问题,并思考RAG与模型本身能力提升之间的权衡。
RAG的效果:事实与局限
我们不能否认RAG确实能显著提升模型的表现。《How faithful are RAG models? Quantifying the tug-of-war between RAG and LLMs’ internal prior》论文研究显示,在没有检索信息时,GPT-4的平均准确率只有34.7%,而加入检索信息后,准确率飙升到了94%。这个结果证实了RAG的有效性。
然而,研究也揭示了RAG的一些局限性:
-
模型与检索信息的"拔河":研究发现,RAG偏好率(模型选择采纳检索信息的比例)与模型对自身先验回答的置信度呈负相关。这意味着模型并不是简单地"照搬"检索到的信息,而是会与自身的知识进行某种程度的"博弈"。
-
对错误信息的敏感性:当检索信息被人为修改时,模型采纳这些信息的可能性会随着偏离程度的增加而降低。这表明RAG并不能完全消除模型的"固执",特别是当检索到的信息与模型的先验知识严重不符时。
-
提示词策略的影响:不同的提示策略会显著影响RAG的效果,这进一步增加了RAG应用的复杂性。
RAG vs. 模型能力提升:高中生查资料vs.升入大学
RAG的方式更像是让高中生查资料解决大学问题,而强化模型本身则更像是提升模型能力由高中升入大学:
RAG(高中生查资料)
优势:
-
快速获取信息:能够迅速获取最新、专业的知识。
-
灵活性高:可以应对各种不同领域的问题。
-
减少训练成本:不需要频繁更新整个模型。
劣势:
-
依赖外部资源:性能受限于检索系统的质量。
-
整合能力有限:可能难以深度理解和综合利用检索到的信息。
-
潜在的不一致性:检索信息可能与模型已有知识冲突。
模型能力提升(升入大学)
优势:
-
深度理解:能够更好地理解和处理复杂问题。
-
推理能力强:可以进行更高级的推理和创新思考。
-
一致性好:知识体系更加连贯和稳定。
劣势:
-
训练成本高:需要大量计算资源和时间。
-
更新周期长:难以快速适应新知识和变化。
-
可能存在知识盲点:训练数据的局限性可能导致某些领域的知识缺失。
深入分析:RAG是未来吗?
1. 知识获取vs.知识理解
RAG无疑提高了模型获取知识的能力,但它并不必然提升模型对知识的理解深度。正如Petroni等人在他们的研究中指出的那样,“虽然检索增强的方法可以提高模型的表现,但它们可能并不总是提高模型的推理能力。”[1]
2. 灵活性vs.稳定性
RAG提供了更大的灵活性,允许模型访问最新信息。然而,如本研究所示,这种灵活性也带来了不稳定性,模型可能在不同查询中表现出不一致的行为。相比之下,提升模型本身的能力可能会带来更稳定和一致的表现。
3. 效率vs.深度
RAG在某种程度上可以被视为一种"效率优先"的方法,它允许模型快速获取和使用外部知识。但正如Guu等人在他们的研究中所强调的,“虽然检索可以提供相关信息,但模型仍然需要强大的推理能力来有效利用这些信息。”[2]
4. 短期收益vs.长期发展
RAG无疑可以带来短期的性能提升,但从长远来看,是否会限制模型自身能力的发展?这是一个值得深思的问题。正如LeCun在他的一篇文章中所言,“真正的智能不仅仅是检索和组合已知信息,而是要能够进行创造性思考和推理。”[3]
平衡与融合的未来
基于以上分析,我们可以得出这样的结论:RAG确实是一项强大的技术,能够显著提升LLM的表现,但它可能并不是LLM发展的唯一未来。
更可能的是,未来的LLM将会是RAG与模型本身能力提升的有机结合。就像一个优秀的学生,不仅要学会如何有效地查阅和使用资料(RAG),还要不断提升自己的基础知识和思考能力(模型能力提升)。
正如Bommasani等人在他们的研究中所指出的,“未来的AI系统可能需要同时具备强大的内部知识表示和灵活的外部知识获取能力。”[4]
一场认知革命的序幕
当我们审视RAG技术与LLM发展的关系时,我们实际上是在探讨人工智能的本质和未来。这不仅仅是一个技术问题,更是一个哲学问题:我们究竟想要创造什么样的AI?
- 知识的海洋vs.思维的火花
RAG无疑为LLM打开了知识的大门,但知识的获取并不等同于智慧的形成。正如爱因斯坦曾说:"想象力比知识更重要。知识是有限的,而想象力围绕着整个世界。"我们必须思考:我们是否只想要一个拥有海量信息的AI,还是渴望一个能真正思考和创新的AI?
- 效率的诱惑vs.深度的追求
在这个追求即时满足的时代,RAG提供了一种看似完美的解决方案 - 快速、准确的回答。但我们不禁要问:这种表面的效率是否以牺牲深度思考和真正理解为代价?如果AI只是信息的搬运工,它还能带来真正的突破和创新吗?
- 依赖vs.自主
过度依赖RAG可能会让AI成为外部知识的奴隶,失去独立思考的能力。但一个真正强大的AI系统应该能够像人类一样,在吸收外部知识的基础上形成自己的见解。我们需要的是能够"站在巨人的肩膀上"而不是"躺在巨人的肩膀上"的AI。
- 技术进步vs.认知飞跃
RAG的出现标志着LLM向着更高效、更准确的方向迈进了一大步。但要实现从"高效工具"到"智能伙伴"的跨越,我们还需要在AI的认知能力上有质的飞跃。这意味着我们不能满足于现状,而要不断挑战AI的极限,探索更高级的认知功能。
-
突破思维定式:不要将RAG视为终点,而应将其视为通向更高级AI的跳板。我们需要不断挑战自己的假设,探索全新的范式。
-
跨学科合作:AI的进步不仅需要计算机科学,还需要认知科学、神经科学、哲学等多学科的智慧。只有跨界合作,我们才能真正理解并模拟智能。
-
着眼长远:虽然短期内RAG可能带来显著的性能提升,但我们更应该关注长期目标。我们的目标不应仅仅是创造一个更好的搜索引擎,而是开发真正能理解、推理和创新的AI系统。
-
重新定义评估标准:我们需要开发新的评估方法,不仅测试AI的知识检索能力,还要评估其理解深度、推理能力和创造力。只有这样,我们才能驱动AI向着更高级的方向发展。
RAG技术的出现,就像是给了高中生一本无所不包的百科全书。这无疑是一个巨大的进步,但我们的目标不应止步于此。我们的终极目标是培养出能够融会贯通、举一反三,甚至能够突破现有知识边界的"AI科学家"。
当下的AI发展正站在一个十字路口。我们可以选择安于现状,满足于创造一个高效的信息检索工具;也可以选择一条更具挑战性的道路,致力于开发真正具有自主思考能力的AI。后者的道路或许更加艰难,但也更加激动人心。
正如图灵在1950年就预见的那样:"我们能否让机器思考,这个问题过于有意义,以至于不能留给未来的人去回答。"七十多年后的今天,这个问题依然悬而未决,而且比以往任何时候都更加紧迫。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。