读论文——Inducing Target-Specific Latent Structures for Aspect Sentiment Classification（EMNLP2020）

最新推荐文章于 2023-03-28 11:48:42 发布

前行follow

最新推荐文章于 2023-03-28 11:48:42 发布

阅读量903

点赞数

分类专栏： # 自然语言处理文章标签：深度学习机器学习 nlp

本文链接：https://blog.csdn.net/y1040468929/article/details/121827802

版权

第一遍

在这里插入图片描述

目前ABSA任务引入图结构后，效果有较大提升，但是仍然存在两个问题：
1. 依赖解析在带噪声的文本上（例如：tweets、blogs、review comments）具有相对较低的准确度
2. treebank可能不是捕获方面词和意见词之间交互的最有效结构
为了研究三种结构归纳方法（自注意力结构、分散注意力、hard Kuma discrete structures），本文建立了一种统一的自注意力网络；此外，为了利用依赖语法的互惠性，进一步考虑了一种新的门控机制，用于在GCN编码过程中合并多个树结构。

在这里插入图片描述

本文使用了一个BiLSTM编码器和一个BERT编码器，BERT编码器输入格式为： $CLS]w_1 w_2. . .w_n[SEP]w_fw_{f+1}. . .w_e$ ,其中 $w_1,..,w_n$ 为输入序列， $w_f,...,w_e$ 为评价对象词，需要注意的是BERT采用了子词（subword level）编码，最后使用汇聚操作，将输出表示为word-level表示（ $w_i \rightarrow \mathbf{c}e_i^o$ ）
为了让编码器学习到aspect-specific的表示，本文采用了基于距离的Aspect-mask的方法；评价对象词的m值为0，其他词距离评价对象词越近， $m_i$ 越大，评价对象词周围词对它的建模能力更强。 $\mathbf{h}_i^o = m_i\mathbf{ce}_i^o$
$m_{i}= \begin{cases}1-\frac{f-i}{n} & 1 \leq i<f \\ 0 & f \leq i \leq e \\ 1-\frac{i-e}{n} & e<i \leq n\end{cases}$

图的邻接矩阵
$\mathbf{A}_{d e p}[i, j]= \begin{cases}1 & \text { if } i \rightarrow j \text { or } i \leftarrow j \\ 1 & \text { if } i=j \\ 0 & \text { otherwise }\end{cases}$