AI大模型开发架构设计（4）——人人需要掌握的大模型微调

最新推荐文章于 2024-08-27 00:11:40 发布

置顶讲文明的喜羊羊拒绝pua

最新推荐文章于 2024-08-27 00:11:40 发布

阅读量2k

点赞数 14

分类专栏： AIGC 文章标签： AIGC Prompt Engineer LangChain Fine-tuning LoRA

本文链接：https://blog.csdn.net/yangwei234/article/details/135737426

版权

13 篇文章 5 订阅

订阅专栏

本文介绍了大模型微调的必要性，包括微调的三个关键能力（提示词工程、框架如LangChain），以及何时选择微调（资源有限、数据相似）、如何微调（全参数与参数高效方式）。还详细解析了LoRA原理，并提供了代码示例和训练过程中的数据集对比。

摘要由CSDN通过智能技术生成

何时 Fine-tuning（微调）
什么情况下使用微调？
不同微调方式
基于LoRA微调

关于模型训练

From Scratch：从头训练
Fine-tune：微调/接着别人的训练

Fine-tune：微调/接着别人的训练
- 对于大模型而言，这很有意义
  - 你要用什么，就训练什么，数据可以更精准，量可以更小
  - 拥有已训练好的大模型的特性优势
  - 成本极大降低

计算资源太少
数据集相似，但数据集数量太少
自己搭建或者使用的 CNN 模型正确率太低
你要使用的数据集和预训练模型的数据集相似，如果不太相似，比如你用的预训练的参数是自然景物的图片，你却要做人脸的识别，效果可能就没有那么好了，因为人脸的特征和自然景物的特征提取是不同的，所以相应的参数训练后也是不同的

关注

专栏目录