大模型微调（finetune）方法

Sophie'sCookingLab

已于 2024-06-30 10:11:01 修改

阅读量594

点赞数 11

分类专栏：大模型文章标签：人工智能

于 2024-06-27 16:56:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40566713/article/details/140017830

版权

微调方法

1、lora

2、adapter

3、prefix-tuning

4、p-tuning

5、prompt-tuning

大模型微调后灾难性遗忘

可以从数据和模型两方面去考虑。

1、通用的指令数据（数据）

主流解决大模型微调后灾难行遗忘的方法是在微调过程中加入通用的指令数据。

2、自我蒸馏方法（数据）

主要是通过模型本身对任务数据进行生成引导，构建自我蒸馏数据集，改变任务数据的信息分布，减少与原始模型信息分布的差距。
Paper: https://arxiv.org/abs/2402.13669
Github: https://github.com/sail-sg/sdft

To address the problem, we introduce Self-Distillation Fine-Tuning (SDFT),a novel approach that bridges the distribution gap by guiding fine-tuning with a distilled dataset generated by the model itself to match its original distribution.
使用模型本身生成一些蒸馏数据集，用这些数据集在来微调模型，这样的话使得模型微调是所用的数据集和

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。