Universal Language Model Fine-tuning for Text Classification

EEE1even

于 2023-11-10 19:12:55 发布

阅读量118

点赞数

文章标签：语言模型人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48435461/article/details/134339630

版权

Universal Language Model Fine-tuning for Text Classification

论文主要表达

提出了关于nlp的泛化模型，以及关键训练步骤（以前的方法都要从零开始训练）

100个标注数据的训练效果可以比之前好100倍

铺垫知识

inductive learning（归纳式学习）对应于meta-learning 从诸多给定任务中学习然后迁移到陌生任务中去

transductive learning（直推式学习）对应domain adaptation 给定的数据包含目标域的数据，要求训练一个对目标域数据又最小误差的模型

以前的方法有什么问题？

从零开始训练，成本大
将预训练的embedding当作固定参数对待，限制了参数的有效信息表达

thinking

以前的方式都是随机初始化模型参数，现在追寻的是使用特定方式来初始化参数，以求在其他条件不变的情况下追求更好的效果

使用fine-tuning的归纳式迁移学习在nlp中很失败
以前的方法需要大量in-domain数据来达到很好的表现，限制了LM的应用
缺少对LM训练方面的知识，一直阻碍着更广泛的应用
nlp模型通常较为浅（shallow），需要不同的微调方法
- shallow与deep形成比较，相对于cv而言，nlp的模型更加浅

现在方法解决了什么？

解决了nlp模型泛化能力不足的问题，可以更广泛的采用

现在怎么做？

使用判别微调（discriminative fine-tuning）
斜三角学习率（slanted triangular learning rates）
逐渐解冻策略（gradual unfreezing）

通过这些方式来保留之前学习的知识，防止在fine-tuning时发生灾难性的遗忘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Universal Language Model Fine-tuning for Text Classification

论文阅读
复制链接

扫一扫

EEE1even CSDN认证博客专家 CSDN认证企业博客

码龄4年

47: 原创

22万+: 周排名

3万+: 总排名

6万+: 访问

: 等级

778: 积分

223: 粉丝

279: 获赞

7: 评论

526: 收藏

私信

关注

热门文章

分类专栏

笔记 3篇

最新评论

frp内网穿透
qq_46143878: 终于找到原因了, 6000端口也要放开
FastGPT+ChatGLM3本地部署
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
FastGPT+ChatGLM3本地部署
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618461564。
Semi-supervised Sequence Learning
CSDN-Ada助手: 恭喜您完成第20篇博客！标题“Semi-supervised Sequence Learning”听起来非常引人入胜。您对这个主题的探索无疑为读者提供了宝贵的见解和知识。我非常期待阅读您的博客，因为我相信您的深入理解将为我们带来更多启发。对于下一步的创作建议，我敢说您已经成为一个博客写作的行家了。然而，我希望您能探索一些与该主题相关的实际案例或应用。这样一来，读者将更容易将理论知识与实践相结合，从而更好地理解和应用您的博客内容。再次感谢您的分享，期待您未来更多优质的博客！
解决java使用API连接HBase超时、连不上问题
飛喽: 大佬，如果部署到linux上，是不是就可以读取到了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

EEE1even 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。