提示工程（Prompt Engineering）、微调（Fine-tuning）和检索增强生成（RAG，Retrieval-Augmented Generation）

弱冠少年

已于 2024-04-20 12:22:26 修改

阅读量2k

点赞数 10

分类专栏： AIGC 文章标签： prompt

于 2024-02-23 14:24:16 首次发布

本文链接：https://blog.csdn.net/qq_40773212/article/details/135819676

版权

AIGC 专栏收录该内容

12 篇文章

订阅专栏

主要参考资料：
还没搞懂嵌入（Embedding）、微调（Fine-tuning）和提示工程（Prompt Engineering）？: https://blog.csdn.net/DynmicResource/article/details/133638079
B站Up主Nenly同学《60分钟速通LORA训练！》
B站《【科普向】什么是RAG检索增强生成？让LLM更靠谱的外挂》

三者区别

在这里插入图片描述
要想知道模型问题的解决方案，首先要知道模型的知识构成。
大模型正常有三种只是路径：大模型训练的语料（蓝图）、用户输入的文本（绿图）和引入外部知识库（橙图）

仅由大模型训练的语料（蓝图）和用户输入的文本（绿图）组成的就是我们经常用的底模，但是这通常会导致1出现幻觉。
仅使用大模型训练语料（蓝图）和外部数据库（橙图），就是3微调（Fine-tuned）了。
仅使用用户输入的文本（绿图）和外部数据库（橙图），就是我们平时使用的搜索了，它不需要自然语言输入、对话管理和大模型。

而把大模型训练的语料、用户输入的文本和外部数据库结合起来，就是4检索增强生成（RAG，Retrieval-Augmented Generation）。
在这里插入图片描述

提示工程（Prompt Engineering）

如果没有良好的提示设计和基础技术，模型很可能产生幻觉或编造答案，其危险在于，模型往往会产生非常有说服力和看似合理的答案，因此必须非常小心地设计安全缓解措施和地面模型的事实答案，所以提示工程应运而生。

微调（Fine-tuning）

微调通过训练比提示(prompt)中更多的示例来改进小样本学习，让您在大量任务中取得更好的结果。对模型进行微调后，您将不再需要在提示(prompt)中提供示例。这样可以节省成本并实现更低延迟的请求。
下面是Nvidia Inception大会上的两张图。微调大致可以分为参数优化微调（Parameter Efficient Fine Tuning）和全量微调（Fine Tuning），典型的就是LoRA方法和SFT。
在这里插入图片描述