五分钟弄清楚爆火的提示工程，RAG和微调

最新推荐文章于 2025-04-19 08:30:00 发布

叶锦鲤

最新推荐文章于 2025-04-19 08:30:00 发布

阅读量2.6k

点赞数 28

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/YeJuliaLi/article/details/135353344

版权

本文介绍了提示工程、RAG（检索强化生成）和微调三种利用大型语言模型提升性能的方法。提示工程通过优化输入引导模型输出，RAG在检索后提供相关信息作为提示，而微调则是调整模型参数以适应特定任务。它们的共性在于提升模型性能，区别则体现在是否改变模型本身结构或使用外部信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大模型语境下的提示工程，RAG和微调是现在非常热点的几个不同的技术方向，他们具体是什么呢？三者的共性与区别是什么呢？今天一文带你搞清楚。

提示工程（Prompt Engineering）

提示工程相对是大家比较熟悉的概念，指的是通过精心设计，并且优化针对large language model的输入，来激发large language model的潜能，引导他在不同的任务上面呈现出更加精准，更加相关的输出出来。

那么大多数情况下prompts指的主要是文本，尤其是以自然语言来作为描述的文本，我们来构建这样的文本，然后把它输入给large language model，得出我们想要的结果，这个就是提示工程。

RAG（Retrieval Augmented Generation）

什么是RAG呢？RAG的全称叫做Retrieval Augmented Generation，翻译成中文的话应该叫做：检索强化生成。一般来说，我们就用它的英文字母缩写RAG来代表这样一个技术。那么RAG这种技术到底是干什么？其实这张图表达的就很清楚了，拿到用户的question之后，先在我们的知识库中去检索和用户的query相关的内容，再基于这些检索的结果，用它来组织prompt，提示给大模型得出我们希望能够得到的那种高质量的准确的响应。

大家一定注意，这里特别关键的一点就是它并不是直接把用户的问题就扔给大模型，而是在此前先有一个信息检索的过程，那么既然要信息检索，那么首先要存在一个知识。因此这里就隐含了一个知识库构建的过程，然后包括我如何在这个知识库中去匹配和我相关的信息的这样的一套技术，那么这些东西加起来就叫做RAG。

微调（Fine-tuning）

微调是另外一种利用大模型的方式，它和前两个不同的地方在于，前面两种技术，不管是提示工程还是RAG，大模型本身是没有任何的变化的，但是如果做微调，其实是要去通过一个训练的过程来修改大模型它本身的参数，微调的技术也有很多种不同的分支，我们在这里重点不是讲微调本身，而是把它和前两种技术来做一下对比。对于微调技术来说的话，它是要在特定的数据集上进一步调整和优化，Large language model里面的部分参数或者是外接的一部分参数，其目的是Fine-tuning large language model能够在特定的任务和应用上面达到一个更加优化的输出。