ACL2020
本文利用数据增强技术TMix对半监督文本分类任务中的为标记数据做增强,并猜测未标记数据的低熵标签,从而让为标记数据与标记数据一样具有可用性。通过混合标记、未标记和增强数据,MixText在几个文本分类基准上显著优于当前的预训练和微调模型以及其他最先进的半监督学习方法。
MixText: Linguistically-Informed Interpolation of Hidden Space for Semi-Supervised Text Classificati
最新推荐文章于 2024-05-18 22:06:58 发布