©PaperWeekly 原创 · 作者|谢悦皎
学校|香港中文大学(深圳)硕士生
研究方向|自然语言处理
论文标题:
Joint Aspect Extraction and Sentiment Analysis with Directional Graph Convolutional Networks
论文链接:
https://www.aclweb.org/anthology/2020.coling-main.24/
代码链接:
https://github.com/cuhksz-nlp/DGSA.
研究动机
本文的研究动机包括以下几点:
1. 首先,情感分析有重要的研究价值,在社交媒体和舆情监测领域都有广泛的应用。端到端方面(aspect)提取和情感分析(EASA)由两部分组成:第一个部分是提取句子中的方面,第二个部分预测句子对该方面的情感极性。
2. 与先提取方面,再预测情感极性的管道方法(pipeline approach)相比,本文采用联合的方面提取和情感分析方法(joint EASA),提供了一个一步的解决方案,采用序列标注的方式在标注每个词是否为方面的同时,标注情感极性。一般地,模型在该任务上的性能高度依赖于模型对上下文信息的建模能力。然而,最近的研究往往局限于使用高效的编码器(例如 BERT),而没有考虑使用更高级的模型框架和利用额外的知识来帮助提升模型的性能。
3. 本文的作者发现,对词和上下文信息的位置关系的建模有益于增强文本的表征,以及不同上下文信息在特定语境下的贡献是不同的。因此,面向联合的方面提取和情感分析任务,本文提出了基于方向建模的图卷积网络(D-GCN)的方法。具体地,该模型利用词与词之间的依存句法关系对上下文信息进行建模,在对不同的上下文信息进行加权的同时,对词与上下文信息的位置建模,并把其引入模型。
模型结构
本文整体的模型框架如图,输入是一个句子(词序列), ( 表示句子中第 i 个词),首先通过 BERT 解码器,对每个 得到隐藏向量 ,然后将 以及邻接矩阵输入到 L 层的 D-GCN 中得到输出 ,最后再通过一层 softmax 解码器得到预测的结果的标签,即方面和情感的联合标签。输出表示为一个标签序列