大模型内容分享(十一)：大模型高效微调（PEFT）方法大全

最新推荐文章于 2025-04-14 18:08:33 发布

之乎者也·

最新推荐文章于 2025-04-14 18:08:33 发布

阅读量3.2k

点赞数 17

分类专栏： AI(人工智能) 内容分享大模型(Foundation Model) 内容分享文章标签：模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45038038/article/details/135322838

版权

目录

PEFT方法效率统计

具体方法具体介绍

3.1 Additive类：Adapters

3.2 Additive类：Soft Prompts

3.3 Selective类

3.4 Reparametrization-based类

PEFT分类

图1. PEFT分类

如上图1，按是否增加了额外参数，PEFT主要分为：

Additive类：在预训练模型基础上增加额外的参数或者网络层，微调训练的时候只训练这些新增的参数或层，包含两个子类：

1）Adapter--在Transformer子层后加入小的全连接层，微调只学习新加的全连接层参数。

2）Soft Prompts--常见的Prompts方法是在输入中构造Prompts模板，如何构造是一门学问，Soft Prompts直接在输入的embedding中加向量作为soft prompts，并对这些向量的参数进行微调，避免构造Prompts模板。

Selective类：选择模型中的部分层比如最后几层、或偏置项进行微调。
Reparametrization-based类：利用低秩表征（low-rank representations）来最小化可训练的参数，本质上就是认为大量的参数中，仅仅一部分起到关键作用，在这个起关键作用的子空间中去寻找参数进行微调。
Hybrid类：混合了多种类别的方法。

PEFT方法效率统计

参数效率（Parameter Efficiency，PE）从广泛的概念讲，包括存储、内存、计算和性能的效率，其中计算效率主要包括微调时反向传播的计算和推理的计算效率。下面是对已收集的方法（论文）从这几个维度进行的统计：

表1. 各种方法的效率统计

其中，Type表示该方法属于Additive、Selective、Reparametrization-based哪一类，Storage、Memroy表示该方法和全部参数微调比较是否节约了存储、内存。Backprop表示是否减小了反向传播计算开销，Inference overhead表示推理时是否增加了开销，比如常见的增加了全连接层。

最低0.47元/天解锁文章

博客等级

码龄6年

1457
原创

2万+
点赞

2万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

大数据内容分享(十一)：OPPO大数据诊断平台设计与实践
zhu.hh: 大佬你这个篇文章的，具体任务cpu和内存的量化公式是从什么地方得到的，能提供下参考文章或者参考文献吗
大模型内容分享(二十)：大模型最全八股(五)
Dubai——embrace: 这个是AI输出的，不好保证正确性吧
架构设计内容分享(一百九十八)：菱形对称架构的演进、定义和价值
a415473410: 正在学习领域驱动设计，关于菱形架构对ddd的实现方案，我觉得是对开发者最友好的方案，也有助于在团队的不同级别开发者间中形成可相互认可的模式，并在概念上形成可讨论的空间。我想表达的是横看成岭侧成峰这样一种感觉，就是合格的开发者都能很快的融入这种开发框架中。我是DDD的初学者，当前正在学习菱形架构，并尝试用这个方案对公司的微服务架构做一次改进，做为后续项目的基础框架。我在学习的过程中遇到了非常多的问题，直到读了大神的佳作，其中对案例的辩证分析，解开了我的一些疑问。大神对概念的引用也恰到好处，感觉非常通透。期待大神能在git上分享一个案例DEMO（按照相对理想的设计模型），这样应该能够在很多细节上有足够的指导。主要是我在尝试按照菱形对称架构的方式去编码时，总有种邯郸学步的感觉，可能是我对领域服务和界限上下的理解上有偏差，找不到专家只能自己摸索，而搜索到的大部分博客都是讲概念的，偶尔有实例又在概念上落地问题很大
AI 内容分享(二十五)：生成式人工智能与未来教育形态重塑
qq_23078315: 你引用可以，标记为你的原创就是你的不对了。这篇来自我的单位——讯飞教育技术研究院24年初发表在电化教育研究的论文《生成式人工智能与未来教育形态重塑：技术框架、能力特征及应用趋势》
设计模式内容分享(十)：组合模式
喛，。: 组合模式的扩展：分别多态了抽象的树叶或树枝构件，这不就是封装了的安全组合。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

之乎者也· 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。