方面级情感分析(一)

方面级情感分析
任务定义
方面级情感分析(Aspect-based sentiment analysis, ABSA)主要包括方面词抽取和方面级情感分类。
ABSA任务需要识别出给定目标中特定方面的情感极性,通常分为两个子任务:方面类型情感分析和方面词项情感分析。
传统方面级情感分析:
在ABSA任务上,早期的工作主要基于人工特征工程,通过人工设计、特征选择,如情感词典、依赖信息等,再利用最大熵、支持向量机等传统分类器进行情感分类。
(1)如Hu[1]提出通过给定的情感种子词语,利用WordNet词典,来查找种子词语的同义词和反义词。
(2)Wagner[2]利用SVM,在人工设计抽取的多种特征上进行方面级情感分类。虽然均取得了不错的性能,但是模型泛化能力差、人工成本高等缺点也逐渐暴露出来。
基于深度学习的情感分析
近些年由于神经网络的兴起,尤其是注意力和记忆力机制成功应用于各类自然语言处理任务,基于深度学习的情感分析方法能够取得最优的效果。该方法最大的优势就是不依赖人工定义特征,神经网络可以自行学习文本中蕴含的情感信息。
现有的基于深度学习的ABSA方法主要分为五类:基于递归神经网络(Recursive Neural Network,RecNN)、基于循环神经网络(Recurrent Neural Network,RNN)、基于注意力循环神经网络(Attention-based RNN)、基于卷积神经网络(Convolutional Neural Network,CNN)和基于记忆力神经网络(Memory Network)的方面级情感分析。

基于递归神经网络的方面级情感分析
(1)Socher[3]提出了RecNN模型,该模型通过语法结构解析树自下而上地递归获得组合单词,因此捕获的语义关系更加细粒度,同时可以运用于更长的短语或句子,该方法在电影评论数据集上达到了79%的情感分析准确率。
(2)基于树结构的递归神经网络(Tree-based RecNN)被引入到ABSA任务上。Dong[4]提出了自适应递归神经网络(AdaRNN)解决基于目标词语的Twitter情感分析,利用依赖解析树寻找在语法上跟目标词有关联的词语,通过自底向上的递归计算获取目标词语的向量表示。实验表明,AdaRNN的分类性能优于传统的机器学习方法以及基本的递归神经网络方法。
基于循环神经网络的方面级情感分析
RNN具有优秀的序列学习能力,目前ABSA任务中的先进方法大多数都是基于循环神经网络进行建模。在此类研究中,模型可以继续细分为三类:循环神经网络、双向循环神经网络、分层循环神经网络。Tang[5]提出基于目标依赖的长短期记忆神经网络(TD-LSTM)和基于目标关联的长短期记忆神经网络(TC-LSTM),实验表明TC-LSTM相比TD-LSTM,可以学习目标词语跟上下文的相互关系,在情感分类准确率上有所提升。Zhang[6]利用门控神经网络结构,通过Bi-RNN对句子中的句法和语义以及方面词与周围上下文词之间的相互作用进行建模。Ruder[7]提出HRNN模型,使用分层双向长短期记忆神经网络学习句内和句间的关系。
基于注意力循环神经网络的方面级情感分析
近年来,注意力机制(Attention Mechanism)在机器翻译、问答系统等自然语言处理任务上取得成功。针对ABSA任务,很多基于注意力循环神经网络的变体不断被提出。注意力机制核心目标在于从众多信息中选择对当前任务目标更为关键的信息,利用注意力机制得到文本中关于某个方面类别的描述表示,将不同的方面类别信息区分开来,从而进行更加准确的情感极性判别,这和方面级情感分析的目标不谋而合。
目前,基于注意力循环神经网络可以分为两类:基本注意力循环神经网络和交互注意力循环神经网络。为了提升方面级情感分析的效果,研究者们在基本注意力神经网络模型上做了大量的工作。
(1)例如,Wang[8]最早将注意力机制引入该任务,提出了一种使用目标嵌入的基于注意力的 LSTM 模型,该工作在LSTM网络基础上为每个目标设置一个注意力向量,强制模型去注意句子中的重要部分,以响应特定的对象。
其后,许多工作在此基础上结合任务的特点对于注意力机制进行了改进,很多基于交互式或迭代式注意力机制被应用于ABSA任务上。
(2)例如,Ma[9]提出了一种交互式注意网络(Interactive attention networks,IAN),使用两个注意力网络来交互式地检测目标描述的重要单词和整个上下文的重要单词。
基于卷积神经网络的方面级情感分析
CNN[10]通过卷积操作和池化操作从原始数据中提取出高级的特征,在计算机视觉领域的有效性已经得到诸多验证。
(1)Huang[11]利用参数化的过滤器门控结构将方面词信息合并到CNN中。
(2)Fan[12]提出了一种卷积记忆网络,该网络融合了注意机制,可以同时捕捉句子中的单词和多单词表达。
(3)Li[13]采用了一种接近策略,利用单词和方面词语之间的位置相关性来缩放卷积层的输入。实验表明,在方面级情感分析任务上,各种卷积神经网络变体的分类性能优于传统的机器学习方法以及基本的卷积神经网络方法。
基于记忆力神经网络的方面级情感分析
Tang[14]将深度记忆网络思想应用到方面级情感分析任务中,通过记忆网络存储给定方面的上下文信息,同时利用注意力机制捕捉该属性与上下文关联的重要程度。
Chen[15]提出了一种基于记忆网络的递归注意机制(RAM),来提取被长距离分隔的情感信息。
Liu[16]针对ASC任务,提出一种基于语境的注意机制,该机制明确考虑到特定方面词与其上下文词语之间的关系。该模型由句子层面的内容注意机制和语境注意机制两部分组成。其中,句子层面的内容注意机制能够从全局的角度捕捉到,整个句子针对方面词语的重要信息,克服了在深层记忆网络模型存在的短视问题。
数据集
SemEval-2014
未来研究方向
(1)低资源情感分析。针对低资源语言,目前缺乏大量且权威的标注数据集,特别是短文本的情感分析数据集。如何训练具有高准确率的无监督或半监督方法,使用上大量的无标签情感数据是情感分析的后续研究方向之一。
(2)跨领域情感分析。由于语言的多样性与复杂性,不同领域间的情感表达差别较大。特别是当领域差异过大时,如在商品评论领域训练的情感分析模型应用到新闻领域上,情感分析的效率和性能会出现下降。
(3)多语言情感分析。现有工作主要针对单一语言,而在单一语言中的情感分析的资源与成果,无法泛化到多语言的环境中,在解决情感分析任务的基本问题外,还需要考虑机器翻译、多语言文本处理等工作,这都对多语言情感分析提出了新的需求。
SVM->
在这里插入图片描述

参考文献
基于深度学习的方面级情感分析综述
待读的三篇ACL2021论文
https://blog.csdn.net/qq_27590277/article/details/119988607

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值