AAAI2021.
本文考虑了低资源文本分类情境下对class对应的关键词进行扩充的问题,每个类收集一组被称为lexicon的词集,根据分类任务计算的注意力权重,并根据注意力系数对关键词进行再分配(注意力的可视化如图1所示)。之后,利用分类器与所构建的lexicon的组合来标记新的数据来引导分类器,以提高预测的准确性。
Methods
与其他的弱(半)监督方法一样,本文提出的方法依旧是迭代的过程,大致可以分为如下几步:
- 从给定的标签数据创建一个基本分类器,这里训练分类器的样本是非常少的。分类器必须包含一个注意机制,以便为每个分类收集关键单词。
- 在未标记数据集