基于aspect的情感分析指的是挖掘句子中涉及的aspect,以及对每个aspect表现出来的情感。现有的工作一般把这个任务分成两个部分:aspect识别,可以是aspect term提取或者aspect分类;aspect的情感识别。aspect term提取指的是从原文本中直接提取涉及到的aspect的单词或词组,而aspect分类指的是为每个领域预定义aspect种类,然后对每个句子进行分类(可以属于一个或多个aspect,也可以不属于任何aspect)。有很多相关的文献把ABSA看作两个分离的子任务,即在判断sentiment并不考虑针对的aspect的信息,这样导致分类不正确,因为同一个形容词对不同aspect或在不同领域形容不同的aspect时表达的情感是不一样的,比如,在restaurant领域,cheap在形容food时是positive的,但形容ambience时表达的是negative。所以在ABSA任务中,需要考虑aspect和sentiment 信息之间的交互。
下面分别针对每个子问题,列举现有的相关研究,从无监督、传统机器学习和深度学习三类方法进行介绍。
aspect识别:
(1)aspect term提取
无监督方法:
Hu 2004:首先从这篇ABSA开山之作开始介绍。本文同时解决了aspect term提取(原文称为feature term提取)以及情感判断问题。这里并不介绍情感判断的方法,而是留在情感识别里介绍。对接下来将要讨论的所有文献都一样。首先需要对所有的单词标注词性,并且认为feature是名词或者名词短语。首先通过关联聚类的方法,提取预料中经常出现的名词或者名词短语。
Popescu 2005:
问题:根据频率提取aspect term有如下缺点:首先,并不是所有的aspect以名词或者名词短语的形式出现,比如It is tasty,其中的aspect是通过tasty表示的,而tasty是形容词;其次,对于一个名词表示的aspect,通过频率容易得到,但是如果aspect是由多个低频的名词组合在一起的时候,频率方法并不那么有效,比如food包含各种鱼类;另外,有的aspect在文本中并不直接提及,是以抽象方式表述的,比如谈论ambience时可以不涉及任何名词。
传统机器学习方法:
深度学习方法:
(2)aspect分类
sentiment识别: