论文阅读笔记:Label-Specific Document Representation for Multi-Label Text Classification

0、简介

  • 论文名字:Label-Specific Document Representation for Multi-Label Text Classification
  • 论文链接:https://www.aclweb.org/anthology/D19-1044.pdf
  • 会议:ACL2019

1、motivation

本文的任务是文本多标签分类任务,在文本多标签分类任务中,一个待分类的文档会有多个标签,因此一篇文档的整体语义信息是由多个部分组成的。本文引入标签信息,使用注意力机制捕获文档和不同标签之间的语以信息。

2、模型结构

在这里插入图片描述

(1)Input Text Representation

本文使用BiLSTM对输入的文本学习representation,BiLSTM隐藏层的双向输出拼接起来当做文本的表示。

在这里插入图片描述

上面公式中H为文本的表示

(2)Self-attention Mechanism

使用self-attention计算文本对每个label的表示,计算公式如下所示:

在这里插入图片描述

A ( s ) A^{(s)} A(s)的维度是 l ∗ n l*n ln l l l是label空间的大小,n是文本中token的个数。 A ( s ) A^{(s)} A(s)代表本文对每个label的attention值。

在这里插入图片描述

上面公式计算得到的 M j ( s ) M_{j}^{(s)} Mj(s)就是文本对第j个label的表示。 M ( s ) M^{(s)} M(s)的维度是 l ∗ 2 k l*2k l2k,是文本对所有label的表示。

(3)Label-Attention Mechanism

self-attention mechanism是基于文本的内容计算attention值的,并没有考虑到label的文字含有的语义信息。因此作者使用label-attention mechanism,将label文字中的语义信息使用起来,计算attention值。作者为他的这个motivation举了个例子。待分类的文本是:

“June a friday, in the lawn, a war between the young boys of the football game starte”

文本被分到了“youth”和 “sports”两类。很明显,文本中“young boys” 应该和“youth”在语义上更相关,“football game”和“sports”更相关。

作者将label的文字进行编码得到label embedding C C C,论文里作者并没有具体说通过什么方式编码得到label embedding的。将 C C C当作query,(1)中得到的文本的embedding H H H当作 key计算attention值,公式如下所示

在这里插入图片描述

这里作者没有使用Bi-LSTM的前后向合并输出,而是将前后向的输出分别计算了attention值。

然后用得到的attention值计算文本对于label的表示,公式如下所示:

在这里插入图片描述

在这里插入图片描述

(4)Adaptive Attention Fusion Strategy

上面步骤我们计算得到两个文本内容和label之间关系表示 M S M^{S} MS M l M^{l} Ml。本文将两M个表示进行融合,融合的方法如下:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

首先使用sigmoid函数将 M S M^{S} MS M l M^{l} Ml缩小到(0,1)的范围内,分别为 α \alpha α β \beta β。然后将 α \alpha α β \beta β normalize,使其和为1,分别得到 α j \alpha_{j} αj β j \beta_{j} βj。通过 α j \alpha_{j} αj β j \beta_{j} βj,将 M S M^{S} MS M I M^{I} MI融合为 M M M
(5) label prediction

得到融合后的文本和label之间的关系表示 M M M后,作者将M输入全连接层和sigmoid函数,得到了文本对应每个label的预测概率,公式如下

在这里插入图片描述

然后用预测值和文本真正的标签计算损失函数,通过最小化损失函数优化模型,公式如下所示

在这里插入图片描述

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值