论文原文:
https://arxiv.org/abs/1805.04174
代码链接:
https://github.com/guoyinwang/LEAM
论文动机:
标签嵌入(Label embedding )已被证明在多个领域和任务中是有效的。在CV中,已经有大量关于利用标签嵌入进行图片分类、图像和文本间的多模态学习、图像中的文本识别的研究。
有大量关于词嵌入的研究,但是关于标签嵌入的研究很少。标签对分类性能起着重要的作用,但在之前的工作中标签仅起监督作用。对标签嵌入设计高效注意模型的有效性研究很少,如何将单词与标签联合嵌入,充分利用标签信息进行文本分类还未见研究。
该论文将文本分类看作一个标签-单词的联合嵌入问题:每个标签与单词向量嵌入在同一个空间,提出了一个attention框架,它度量文本序列和标签嵌入之间的兼容性。attention是在一组带标签的训练样本上学习的,以确保给定一个文本序列,相关单词的权重高于不相关单词。