![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/0d2644859fab5e35f895aaa483699362.png)
本文发表于EMNLP2020。
本文提出了一个基于卷积模型的蒸馏方法,实现了一个轻量级的、快速的半监督文本分类框架FLiText,相比于Bert等大规模预训练模型,蒸馏模型更具备实际应用价值。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/0f382680bb85f5521d5aa19897f20022.png#pic_center)
Method
模型总体的框架如下,大致分为激励网络和目标网络两部分:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/124a92df907671d7055b4d9c56197eab.png)
激励器网络(预训练语言模型)利用一致性正则化和数据增强技术,充分挖掘未标记数据和有限标记数据中的信息和特征。然后在输出和隐藏空间两层提供正则化约束,引导轻量级目标网络仅使用少量标记数据实现高效的半监督学习。
本文使用 X = ( x i