Universal Language Model Fine-tuning for Text Classification(ULMFiT)阅读笔记

最新推荐文章于 2022-03-31 16:56:00 发布

Leokb24

最新推荐文章于 2022-03-31 16:56:00 发布

阅读量373

点赞数

分类专栏：论文阅读文本分类论文阅读文章标签：文本分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leo_95/article/details/89221762

版权

UMFiT是一种基于迁移学习的文本分类方法，它包括通用语言模型预训练、目标任务的语言模型微调和分类器微调三个阶段。论文提出了差异化微调、倾斜三角学习率和逐步解冻等技术，提升了模型在小数据集上的表现。实验中，使用了AWD-LSTM模型，并调整了各种参数以优化效果。

摘要由CSDN通过智能技术生成

UMFiT

Introduction

文章贡献点:

利用迁移学习的思想, 提出基于微调的通用语言模型(ULMiT)
提出discriminative fine-tuning, slanted triangular learning rates, gradual unfreezing等方法

Model

进入正题, 先来看下模型结构

首先预训练一个语言模型, 论文中采用的是AWD-LSTM(没有attention, short-cut connection, 只是加了很多dropout等防止过拟合的策略).
整个模型训练主要分为三部分:

General-domin LM pretraining
Target task LM fine-tuning
Target task classifier fine-tuning

1. General-domin LM pretraining

在Wikitext-103上预训练一个语言模型, 其中包含28595篇处理过的文章.
预训练对小数据集的任务帮助很大.

2. Target task LM fine-tuning

利用目标任务数据集对预训练模型进行fine-tuning.
针对f

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。