AAAI 2018| Improving Review Representations with User and Product Attention Sentiment Classification

最新推荐文章于 2022-02-15 13:32:28 发布

Raymond_MY

最新推荐文章于 2022-02-15 13:32:28 发布

阅读量1.4k

点赞数

分类专栏： Papar NLP

本文链接：https://blog.csdn.net/Raymond_MY/article/details/89034151

版权

NLP 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

Papar

1 篇文章 0 订阅

订阅专栏

最近有一个计划——40篇论文储备计划，是老班要求的。有的解读可能会放上来，有的不会。同时会把论文的地址放出来，希望能传播一些好文章吧~

论文名称：Improving Review Representations with User Attention and Product Attention for Sentiment Classification
论文链接：https

Improving Review Representations with User Attention and Product Attention for Sentiment Classification

Abstract
Introduction
Background
Method/Model
Experiments
Conclusion

Abstract

神经网络方法在情感分类中取得了巨大的成功。最近，一些工作通过结合用户和产品信息来生成评论表示，在分类结果上取得了一些进步。但是通过观察，发现在用户评论中，有一些句子或是词表示了很强的用户个人看法，也有一些句子或是词表示了产品的相关特性。在直觉上，这两种不同的信息在情感分类中起到了不同的作用。因此，将这两种信息结合在一起来编码来形成一种表示是不太合理的。

在本文中，作者提供了一种全新的框架来编码用户信息和产品信息。首先，应用了两种独立的遗传神经网络来生成两种不同的表示；然后，设计了一种将这两种表示结合在一起的策略，以便之后进行最终的训练和预测。

在IMDB和Yelp数据集上的实验证明了这种方法性能好于目前的最新方法，并且通过可视化的方法来给出一些词与用户或是产品的相关性，证明了文中方法的有效性。

Introduction

随着在线评论网站如Amazon，Yelp，IMDB的快速增长，情感分析引起了研究者和工业界的重视。在这篇文章中，作者的工作关注了Document-level的情感分类问题。

尽管神经网络在情感分类中十分有效，但是前人的一些工作主要关注了文本相关，但是忽略了用户和产品信息的重要影响。用户的喜好和产品的特性对于评分有着重要的影响。对于不同的用户，同样的词可能表示了不同了意思，比如一个宽容的用户可能会使用“good”来评价一个正常的产品，但是一个苛刻的用户可能会使用“good”来表达非常棒的意思。同样的，产品特性也会对评论分数产生影响，一个好的产品评分肯定比一个坏的产品分数高。

为了将用户信息和产品信息在情感分类中加以运用，前人的一些工作有：

[Tang, Qin, and Liu 2015b] Tang, D.; Qin, B.; and Liu, T. 2015b. Learning semantic representations of users and products
for document level sentiment classification.引入word-level的偏好矩阵，表示用户和产品的向量，使用CNN来进行分类。但是模型复杂度太高，只考虑了word-level，没有考虑的semantic-level
[Chen et al. 2016a] Chen, H.; Sun, M.; Tu, C.; Lin, Y.; and Liu, Z. 2016a. Neural sentiment classification with user and product attention.在一个句子中引入注意机制，但是将用户信息和产品信息放在一起考虑了，丢失了一些信息

在本文中，针对之前研究中的问题，作者应用了两种独立的遗传神经网络来生成两种不同的表示；然后，设计了一种将这两种表示结合在一起的策略，以便之后进行最终的训练和预测。

本文的主要贡献：

提出了一个全新的框架来从两个角度来编码用户评论。分别使用了用户注意机制和产品注意机制生成了两种表示，之后将二者拼接在一起进行下一步分类。
为了更好的学习结果，引入了一个结合策略来提升表示。使用了带权的损失函数证明了两种角度都对分类效果有提升。
实验证明了本文中的模型比现有方法对分类结果有显著提升。

Background

LSTM

Attention Mechanism

Document-level Sentiment Classification

Method/Model

本节将介绍文中出现的模型——HUAPA
在这里插入图片描述

Hierarchical User Attention

从一个用户的角度来看，不是所有的词都同等意义上表现了用户的情感。为了突出一些重要的词，引入了用户注意机制来提取这些词。最终，一个句子的表示将会聚集这些重要的词。一个增强型的用户角度表示的句子公式如下
在这里插入图片描述
其中， $h^u_{ij}$ 表示第i个句子的第j个词的隐藏状态， $\alpha^u_{ij}$ 是对 $h^u_{ij}$ 的注意力权值，描述了第j个词对于当前用户的重要程度。作者将每个用户都映射到一个连续的向量u中，这里 $\in R^{d_u}$ ， $d_u$ 表示了用户向量的维度。对于每个隐藏状态的权值 $\alpha^u_{ij}$ 计算如下
在这里插入图片描述
其中， $v^u_w$ 是一个权值向量， $W^u_{wh}$ 和 $W^u_{wu}$ 是权值矩阵。 $e ()$ 函数用于对一个词的重要性进行评估。

前面我们看到的是word级别的，而在作者的目标是形成一个文档级别的分类效果，所以还有句子级别的扩展如下：
在这里插入图片描述
其中， $h^u_{i}$ 表示第i个句子在评论中的隐藏状态， $\beta^u_{i}$ 是对 $h^u_{i}$ 的注意力权值，描述了第i个句子对于当前用户的重要程度，计算方法同上所述。

Hierarchical Product Attention

这里的模型和上面的用户角度完全一样，唯一区别就是分开训练，预先设定的参数不同。
在这里插入图片描述
其中， $\alpha^p_{ij}$ 是对 $h^p_{ij}$ 在单词级别上的权重， $\beta^p_{i}$ 是对 $h^u_{i}$ 在句子级别上的权重。

Combined Strategy

为了充分利用之前生成的用户角度和产品角度信息，需要考虑将两个表示结合起来形成一个最终的表示。
在这里插入图片描述
使用了一个线性的softmax来输出预测结果

在本模型中，使用交叉熵损失函数cross-entropy error来描述预测值和真实值之间的损失

其中， $p^g_c$ 表示了情感标签c的可能性的真实值，0或是1， $T$ 是训练集的大小。
同理，对于两个角度的损失函数，同样有下面的式子
在这里插入图片描述
之后，我们定义总的损失函数 $L$
通过改变不同的权值，可以得到不同的训练效果。

Experiments

Experiments Settings

使用的数据集：IMDB，Yelp Dataset Challenge in 2013 and 2014.数据集划分是80%训练集，10%验证集，10%测试集。
使用 $A c c u r a c y$ 来衡量准确率， $R M S E$ 即标准差来衡量偏差程度。
在这里插入图片描述
其中， $T$ 是预测正确的数目 $N$ 是样本总数 $gd_k$ 表示正确的标签 $pr_k$ 表示预测的标签
具体的设置：