LLM - AI四件套 : 大模型、RAG、AI AGENT 、Workflow

小小工匠

于 2025-03-30 10:56:31 发布

阅读量2.4k

点赞数 23

分类专栏：【LLM大模型】文章标签：大模型 RAG AI AGENT Workflow

本文链接：https://blog.csdn.net/yangshangwei/article/details/146723074

版权

【LLM大模型】专栏收录该内容

22 篇文章

订阅专栏

文章目录

引言
大模型：AI界的"学霸"进化史
RAG：给AI配了个“外挂大脑”
智能Agent：你的AI"赛博打工人"
智能工作流：AI界的"流水线大师"
小结

引言

十年前，如果有人跟你说"电脑能像人一样写文章、解答难题，还能自己安排工作"，你肯定觉得他在吹牛。但现在呢？ChatGPT能和你聊天、写代码、翻译古诗；智能助手能帮你排日程、写报告——这些我们早就习以为常了。

其实这些"魔法"背后，是几个关键技术撑起来的：

大模型：就像给电脑灌输了海量知识的大脑
RAG：让AI能随时查阅资料补充答案
智能体：相当于AI的"手脚"，能主动干活
工作流：把多个AI能力像流水线一样串起来

接下来咱们就用大白话，掰开揉碎讲讲这些技术是怎么让AI变聪明的。就像拆解魔术一样，看完你就明白这些"黑科技"其实没那么神秘。

在这里插入图片描述

大模型：AI界的"学霸"进化史

以前的人工智能像偏科生——训练一个只会翻译，另一个只会算数，每个AI都只会一门手艺。就像你养了一屋子宠物：狗看门、猫抓老鼠、鹦鹉学舌，各干各的。

突然有一天，科学家们养出了个"超级学霸"（大模型）。这家伙的秘诀就三点：

海量填鸭式教育：把整个互联网的书籍、论文、对话都塞给它"读"，相当于让一个人不吃不喝读几万年书
通才培养方案：不像过去专门教数学或写作，而是让它们自己从数据里总结规律
举一反三绝活：比如GPT-3，给它看两三个例子就能模仿出新内容，像人类突然开窍

效果多夸张？

参数从GPT-2的15亿暴涨到OpenAI 在 2020 年推出的 GPT-3的1750亿，相当于大脑神经突触多了100倍
突然就会了"超纲技能"：没专门教过写诗，但给个开头就能续写莎士比亚风格十四行诗

这带来革命性变化：
以前开发AI像造瑞士军刀——每加个功能都得重新设计工具。现在像用乐高积木，拿现成的"学霸大脑"（基础模型）稍加调整：

想翻译？给它看几个例句就行（提示学习）
要客服？微调对话数据就能上岗
甚至能跨语言干活：训练时见过中英文对照，就能当中英翻译

但别被名字忽悠了
"大"模型不只是体积大，关键是学东西的方式变了——就像人类婴儿先广泛认知世界，再快速适应具体任务。现在所有AI应用都在这个"学霸大脑"上做加减法，这才是真正的范式革命。

但这个"学霸"也有致命缺陷——它其实是个会编故事的失忆症患者，这时候就需要RAG技术来补救了…

RAG：给AI配了个“外挂大脑”

你以为大模型是“百科全书”？其实它更像一个会编故事的学霸——知识停留在训练截止日（比如GPT-4只学到2023年），问它“2024年欧冠冠军是谁”，它能给你编个皇马vs拜仁的精彩战报，但其实压根没这比赛！

怎么办？
科学家们一拍大腿：让AI学会“作弊”不就行了？ 于是搞出了RAG（检索增强生成）——相当于给AI配了：

一个实时更新的搜索引擎（比如联网查资料）
一个私人知识库（比如公司内部文档、行业报告）

怎么“作弊”？分三步：

先搜后答：你问“今年iPhone有什么新功能？”，AI不会瞎猜，而是先去苹果官网、科技媒体扒最新消息
把资料塞进问题里：像考试时偷偷把小抄和考题一起递给AI：“这是2024年9月苹果发布会的资料，请根据它回答…”
结合资料编人话：AI不再凭空捏造，而是基于真实信息生成回答

在这里插入图片描述

检索（Retrieval）：根据用户查询，从预先构建的知识库中找出相关信息。现实中，这个知识库可以是维基百科文章集合、公司内部文档，甚至互联网搜索引擎的结果。为了高效匹配查询和文档，系统会把文本预先转换为“向量”（一种数值表示），通过向量相似度来找最相关的内容片段。
增强（Augmentation）：将检索到的内容与用户原始问题合并，形成一个增强过的提示（Prompt）。这个提示把外部知识充当“背景资料”提供给大模型，相当于为它补课，确保模型在回答时参考最新且相关的信息。
生成（Generation）：大模型接收到包含背景知识的提示后，基于其中的信息来生成回答。因为参考了检索资料，回答往往更加准确、有依据，并且能够涵盖最新的事实。

实际效果多离谱？

问Kimi“马斯克上周又整了什么新活？”，它能瞬间读完7篇新闻，总结出“星舰试飞炸了但马斯克说炸得好”
让AI读《甄嬛传》剧本，它能记住“安陵容第38集给皇后下毒用的是麝香”这种细节，堪比追剧十遍的闺蜜
临时塞给它两本医学书，下一秒就能装老中医把脉：“舌苔发黄？你这是肝火旺啊！”

为什么这技术炸裂？

防忽悠：AI不再自信满满地胡说八道（比如声称“2025年马云买了特斯拉”）
免培训：不用重新训练模型，往知识库里扔最新PDF/网页就能让AI“学会”新东西
超长记忆：普通AI记不住超过10页文档，但RAG能让它“现场翻书”处理几十万字

你在哪儿见过它？

微软Bing聊天：一问“今天美股涨了吗”，立刻偷摸查财经网站再回答
Kimi的“联网搜索”功能：其实就是RAG的开关版
企业客服机器人：背后连着一堆产品手册，随时调取最新参数

但RAG也不是万能的
如果知识库本身有错误（比如维基百科被人乱改），AI照样学歪。所以现在最火的玩法是：大模型当大脑 + RAG当记忆 + 人工校验当保安，三位一体才能产出靠谱答案。

so 智能体——光会查资料不够，AI还得学会“自己点外卖叫滴滴”，这才是真·数字打工人

智能Agent：你的AI"赛博打工人"

想象一下：

普通AI像问答机——你问它答，答完就躺平
智能Agent像全能助理——你只说"我想去三亚玩"，它就能自己查机票、订酒店、做攻略，最后把行程表甩你脸上

**这不是科幻！**现在的AI已经能：

自己写代码→运行代码→发现bug→改代码（全程不用人插手）
接到"帮我卖二手手机"任务后，自动：
1. 查闲鱼同类价格
2. 写诱人文案
3. 上传照片
4. 和买家砍价
5. 成交后提醒你发货

拆解Agent的"超能力"：

大脑（LLM）：理解任务+做决策
- 比如判断"订酒店"要先查目的地再比价
工具箱（Tools）：
- 浏览器：查实时信息
- 计算器：算折扣
- API：调取企业数据
记忆系统（Memory）：
- 短期：记住刚才选了哪家酒店
- 长期：学习你总爱订靠海房间
反思机制（Reflection）：
- 如果订房失败，会尝试换日期或换平台

在这里插入图片描述

规划（Planner）：负责制定行动计划。面对一个复杂目标时，Agent 需要把它拆解成一系列可执行的步骤，决定先做什么再做什么。这相当于脑海中规划路线。规划可以由 LLM 本身通过“思考”实现，也可以由一个专门的规划算法模块完成。在一些实现中，这一步称为思维链（Chain-of-Thought）推理，即模型在给出最终答案前先产出一串中间推理步骤，就像在脑海中打草稿。
执行器（Executor）：负责执行具体动作。比如，当 Agent 决定“现在需要上网搜索一下最新天气”，执行器就会调用相应的搜索 API 并将结果返回给 Agent；或者 Agent 决定“运行一段代码计算答案”，执行器则负责在沙盒环境执行代码并反馈输出。可以理解为，执行器是 Agent 与外部环境交互的“手和脚”，按照 Agent 的指令实际动手操作。
工具使用（Tools）：这是 Agent 可以调用的一系列外部工具的统称。工具可以是各种各样的东西——查询数据库、调用网络服务、运行计算程序、访问专有信息源等等。工具为 Agent 扩展了能力边界：有了工具，一个语言模型 Agent 就不仅能对话，还能“触碰”外部世界（例如调用浏览器获取最新信息，或使用计算器进行精确计算）。正如前面的例子，小明 Agent 通过调用订票网站和日历应用这些“工具”，才能真正完成旅行预订任务。
记忆（Memory）：用来存储 Agent 在交互过程中的关键信息。这里的记忆可以分为短期记忆和长期记忆。短期记忆指的是当前对话或任务的上下文（类似于人类的工作记忆），通常由 LLM 的上下文窗口维护；长期记忆则可以通过外部存储（如向量数据库）实现，用于保存跨越多轮交互的重要信息，随时供 Agent 检索调用。比如一个持续工作的 Agent 需要记住之前已经完成了哪些子任务、遇到了哪些障碍，这些信息就可以存入长期记忆以备后续参考。

通过以上组件的分工协作，Agent 实现了一个闭环：感知-思考-行动-再感知。它感知环境（通过读取输入和工具反馈）、思考决策（由 LLM 规划）、付诸行动（调用工具执行），再将行动结果纳入记忆，继续下一步。如此循环，直到达到目标或无法继续。这个过程与我们人类解决问题的方式非常相似。

在这里插入图片描述

真实案例炸裂现场：

AutoGPT：你让它"开个跨境电商店铺"，它能：
→ 调研热卖品类
→ 注册账号
→ 设计LOGO（调用DALL·E）
→ 写产品描述
→ 虽然最后可能搞出个卖"AI生成独角兽T恤"的鬼畜店铺…
Devin（首个AI程序员）：
接到需求后自己：
① 写代码 ② 部署测试 ③ 修bug ④ 写开发报告
人类只需要喝咖啡围观

但别急着高潮…
现在的Agent就像刚实习的应届生：
✓ 能跑腿打杂（“订三张机票”）
✗ 别指望它做CEO（“把公司市值翻倍”）
常见翻车现场：