参数高效微调方法（Parameter-Efficient Fine-Tuning，PEFT）概述

最新推荐文章于 2025-03-26 10:35:52 发布

2301_77818837

最新推荐文章于 2025-03-26 10:35:52 发布

阅读量3k

点赞数 13

文章标签：机器学习深度学习人工智能语言模型

本文链接：https://blog.csdn.net/2301_77818837/article/details/135355289

版权

本文介绍了参数高效微调，一种针对大模型设计的迁移学习方法，通过只微调部分参数来节省计算资源和存储空间。文章详细讲述了其分类，如选择性方法（如适配器）、添加性方法（如软提示词和LoRA）和重新参数化方法，并预告后续将深入探讨代表性方法如Adapterstuning、LoRA等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参数高效微调是指通过在预训练模型上仅微调部分参数来实现微调的策略。相较于全量微调，该方法节省计算资源和时间，特别适用于数据量有限、资源有限的情况。它也算是一种迁移学习的方法，但是与传统的迁移学习方法不同的是，它是专门针对大模型设计的，通常会保持原有模型的参数不变，以某种方式添加少量新的参数，通过调整这些新的参数使模型适应特定任务，同时保留底层通用的语义表示。而传统的迁移学习方法一般要达到比较好的效果，都不得不调整一部分原有模型的参数。同时，在保存或移植模型时，PEFT只要维护添加的那些参数，而传统的迁移学习方法需要保存整个调整后的模型，当需要微调很多任务时，通过PEFT微调模型可以大幅节省存储空间。

目前，参数高效微调因其调整的参数占比很小（小于10%甚至0.1%），所需运算资源少，在同时需要出来很多下游任务时，节省大量存储空间，在目的单一的较小的样本集里（小于预训练语料的10%），已逐渐成为主流的微调方法。近年来，参数高效微调发展迅速，已出现30种以上的参数高效微调方法，如所示，它们可以分为3大类：

选择性方法（selective）：只微调原始LLM参数的子集。
添加性方法（additive）：通过添加一些可训练的层或参数来调整基础模型。它又可以分为2个小类：
1. 适配器（adapters）：通过在基础模型中加入一些可调整参数的组件、模块来使模型适应下游任务。
2. 软提示词（soft prompts）：通过某种方式达到给输入加入提示词的效果，从而适应下游任务。
重新参数化方法（reparameterization-based）：通过创建原始网络权重的新低秩转换来减少要训练的参数数量。