【(强推)李宏毅2021/2022春机器学习课程】2022-如何有效的使用自监督模型-Data-Efficient &Parameter-Efficient Tuning

算法研究员

已于 2022-04-23 23:52:13 修改

阅读量1.4k

点赞数

文章标签：机器学习

于 2022-04-23 23:50:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43154149/article/details/124370319

版权

文章目录

1. self-pretrain是什么
2. 存在问题
3. Data-Efficient Fine-tuning：Prompt Tuning（提示，更有效地利用数据，比如数据量少的情况下）
- 数据量更少
4. Data-Efficient Fine-tuning：Semi-supervised Learning（半监督）
5. zero-shot
6. PLMs Are Gigantic -> Reducing the Number of Parameters（对于model很大的时候的解决方法）
7. Closing Remarks

在这里插入图片描述
资料：pdf | 视频

1. self-pretrain是什么

两种训练方式：

预测下个词
掩码学习

在这里插入图片描述

fine-tune：胚胎干细胞，还需要fine-tune才能发挥威力
在这里插入图片描述

2. 存在问题

微调还是需要一些数据的
在这里插入图片描述
模型太大了

3. Data-Efficient Fine-tuning：Prompt Tuning（提示，更有效地利用数据，比如数据量少的情况下）

在这里插入图片描述

跟 Standard fine-tuning的差别

Prompt Tuning在数据量少的情况下会有很好的表现

数据量更少

在这里插入图片描述

4. Data-Efficient Fine-tuning：Semi-supervised Learning（半监督）

在这里插入图片描述

5. zero-shot

在这里插入图片描述

6. PLMs Are Gigantic -> Reducing the Number of Parameters（对于model很大的时候的解决方法）

在这里插入图片描述

Parameter-Efficient Fine-tuning

在这里插入图片描述

Adapter

在这里插入图片描述

LoRA（比Adapter参数量更少（feature压缩得小），推理更快（平行插入））

在这里插入图片描述

Prefix Tuning（核心：fine-tuning就是要改变hidden representations）

在这里插入图片描述
复习Self-attention

在这里插入图片描述

在这里插入图片描述

Soft Prompting

在这里插入图片描述

4个方法总结

在这里插入图片描述

Early Exit（减少inference推理时间）

在这里插入图片描述

7. Closing Remarks

在这里插入图片描述

算法研究员

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。