刘知远大模型学习笔记-Delta Tuning

最新推荐文章于 2025-02-21 19:05:27 发布

华山菠萝吹雪

最新推荐文章于 2025-02-21 19:05:27 发布

阅读量652

点赞数 4

文章标签：学习笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jennieg/article/details/137089281

版权

Delta Tuning学习知识

本博客记录我学习B站【清华NLP】课程中的内容与想法，这是本系列第二篇，后续可能还会有更新。

文章目录

Delta Tuning学习知识
Delta Tuning介绍
一、增量式tuning
二、指定式tuning
- 代表方法：BitFit
三、重参数化式tuning
- 代表方法1：Instrinsic Prompt Tuning
- 代表方法2：LoRA
总结

Delta Tuning介绍

Prompt Learning对于位置任务不太适用，但是认为可以用于多模态。也就是图片与文本理解。
Delta Tuning核心思想：绝大多数参数不变，只微调一小部分模型，优化特别少参数。也就是把解决任务抽象为一小部分参数（Delta Objects）。
有了预训练大模型，这类方法才有用。

分类：Addition，增量式；Specification，指定式；Reparameterization，重参数化式（现在超级常用的LoRA)。

提示：以下是本篇文章正文内容，下面案例可供参考

一、增量式tuning

代表方法1：Adapters

代表方法1：Adapters
事实上，Adapter就是简单的MLP，双层神经网络，实现上投影与下投影，输入维度与输出相同。
在Transformer架构中加入两个Adapter，只训练Adapter部分，大模型效果可能会更好。
Adapter-tuning
后续改进工作还有把Adapter放在主模型外的，反向传播时不需要经过backbone，更省计算。且进行降维之后还减少内存占用。

代表方法2：Prefix-Tuning

soft token：可以理解为模型试图学习或优化的可微调的词嵌入
Prefix-Tuning在每个隐藏层中加入soft token进行优化

代表方法3：Prompting

只在输入层加入soft prompts

二、指定式tuning

代表方法：BitFit

做法：只微调transformer中的偏移（bias），简单任务上能达到和全参数效果差不多。

三、重参数化式tuning

核心思想：模型优化可以用很小的代价完成。

代表方法1：Instrinsic Prompt Tuning

假设：优化的过程可以在低维子空间进行，许多任务中有公共子空间。

代表方法2：LoRA

不认为模型是低维，而是认为本质是低秩的，可以强行的做低秩分解，节省计算量。LoRA冻结预训练模型的权重，并在每个Transformer块中加入分解的可训练层（称为秩分解矩阵）。

总结

可以找一种更好的方法，因为所有的delta tuning都可以认为是在更小的空间去寻找答案。模型特别大的时候可能结构的重要性会下降，delta tuning在超大模型中会发挥的超级好。

华山菠萝吹雪

博客等级

码龄5年

14
原创

162
点赞

186
收藏

143
粉丝

关注

私信

热门文章

分类专栏

笔记

展开全部收起

最新评论

大模型-Sora技术解读
CSDN-Ada助手: 恭喜您发布了第14篇博客《大模型-Sora技术解读》，内容相当精彩！您对Sora技术的解读深入浅出，让读者受益匪浅。接下来，我建议您可以继续深挖Sora技术的应用领域，或者探讨Sora技术与其他领域的结合，以便给读者带来更多启发和思考。希望您能继续保持创作的热情和耐心，为我们带来更多有价值的博文！
论文阅读-DiT：Scalable Diffusion Models with Transformers
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
轻松玩转书生·浦语大模型趣味 Demo-笔记2
CSDN-Ada助手: 恭喜用户第12篇博客的发布！看到您对浦语大模型的探索与分享，让人感受到了您的热情与专注。希望您可以继续保持创作的热情，不断探索新领域，为读者带来更多有趣的内容。或许在下一篇博客中，您可以结合实际案例或者个人心得，加深对于浦语大模型的理解，让读者更容易上手并体会其中的乐趣。期待您的下一篇作品！
大语言模型微调框架学习记录：LoRA、全参数、PEFT、RLHF
Accaen: 讲得很清楚！
论文阅读：FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects-6DoF位姿估计
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。