情感分类论文、代码汇总

最新推荐文章于 2025-03-19 10:53:59 发布

可爱的萌新程序员

最新推荐文章于 2025-03-19 10:53:59 发布

阅读量5k

点赞数 11

分类专栏：机器学习自然语言处理

本文链接：https://blog.csdn.net/ymmccc/article/details/88651527

版权

自然语言处理同时被 2 个专栏收录

4 篇文章

订阅专栏

机器学习

3 篇文章

订阅专栏

1、Disconnected Recurrent Neural Networks for Text Categorization

哈工大讯飞联合实验室的一篇论文，非常棒的是这篇论文有中文版本！
论文思路比较简单，想结合CNN和RNN两者的优点。需要调整窗口超参。代码使用tensorflow实现。
论文地址：http://aclweb.org/anthology/P18-1215
中文版论文地址：https://kuaibao.qq.com/s/20180522G0V3R500?refer=spider
知乎阅读笔记：https://zhuanlan.zhihu.com/p/52173441
代码地址：https://github.com/liuning123/DRNN

2、Aspect Based Sentiment Analysis with Gated Convolutional Networks

多数实验使用LSTM和attenion机制来预测有关目标的情感极性，但模型往往很复杂并且需要很长的训练时间。本文提出了一个基于CNN和Gating Mechanisms（门机制）的模型。一种新的Tanh-ReLU 门单元能够根据给定的aspect或实体选择输出的情感特征。这个结构比应用于现有模型的attention层简单得多。同时，本文中模型的计算在训练中很容易并行化，因为卷积层不像LSTM层那样有时间依赖性，并且门单元也能够独立工作。本文在SemEval 数据集上进行试验，表明了实验效果的提升。
论文地址：http://www.aclweb.org/anthology/P18-1234
代码地址：https://github.com/wxue004cs/GCAE
知乎阅读笔记：https://zhuanlan.zhihu.com/p/50284374

3、Hierarchical Attention Networks for Document Classification

论文地址：https://www.aclweb.org/anthology/C/C16/C16-1047.pdf
代码地址：https://github.com/vietnguyen91/Hierarchical-attention-networks-pytorch
https://github.com/cedias/HAN-pytorch

4、Recurrent Attention Network on Memory for Aspect Sentiment Analysis

代码使用tensorflow实现。
论文地址：https://www.aclweb.org/anthology/D17-1047
代码地址：https://github.com/lpq29743/RAM/blob/master/model.py
知乎阅读笔记：https://zhuanlan.zhihu.com/p/34043504

5、Sentiment Classification towards Question-Answering with Hierarchical Matching Network

这篇论文介绍的是关于电商平台问答的情感分析，类似淘宝的“问大家”这种形式的问题对，根据问题答案对来分析其中的情感。
该论文的贡献主要有两个：

提出了一个新问题，即问答情感分析。并且上传了一份用于研究该问题的标注数据。数据链接地址：https://github.com/clshenNLP/QASC/
对这个新问题提出了一种专门的解决方法，即题目中的分层匹配神经网络。

该论文首先介绍了这个任务描述，然后分析这种任务为什么不适合直接用传统的情感分析技术来进行研究，并提出了一种专门针对这种问答的情感分析研究方法，叫作分层匹配神经网络，该方法分为三步：

将问题和答案都分解为一个个短句，然后对于每个Q和A中的短句构建 [Q-sentence, A-sentence]单元。
使用一个QA双向匹配层，将每个[Q-sentence, A-sentence]单元编码为一个向量，以便用于后续情感分析。
使用自我匹配注意力层（self-matching attention layer）让模型自动捕捉每个[Q-sentence, A-sentence]匹配向量的重要程度，以便更好的推断Q-A的情感极性。

其网络结构如下图所示：
分层神经网络结构

关于作者分析的标注数据集：
数据来源：淘宝的“问大家”，主要包括美妆、鞋和电子产品这三个领域，每个领域收集了10000条问答对。
标注说明：对于情感分类的标注结果有三类，分别是positive, negative, neutral,conflict。其中conflict代表这个问答对中既包含对整体评价对象的积极情感，又包含消极情感。比如：“Q：这个手机好用吗？ A：手机使用起来手感很好，非常流畅。但是电池不太好，一会儿就没电了！”。这个Q-A就会被标注为“conflict”。
而neutral并不一定是中立的，按照作者描述的规则，以下这些情况都会被标注为“neutral”：

答非所问。比如“Q：屏幕清楚吗？ A：电池寿命很长！”
不确定的回答，“我不知道”这种回答。比如“Q：这款手机怎么样？ A：不知道，买来送人的”
不包含感情的客观事实。比如“Q：手机什么颜色？ A：蓝色”
对比两个或多个产品的问答。比如“Q：这款手机和iPhone6相比怎么样？ A：那决定于你，它们是不可比较的”

论文地址：https://aclweb.org/anthology/D18-1401
数据链接地址：https://github.com/clshenNLP/QASC/
代码地址：暂无代码。

6、A Cognition Based Attention Model for Sentiment Analysis

论文地址：https://www.aclweb.org/anthology/D17-1048
代码地址：暂无代码。

7、Hierarchical Attention Networks for Document Classification

篇章级的文本分类，思想是首先用GRU+词级别的Attention机制对每个短句进行建模，然后用另一个GRU+句子级别的Attention机制对整篇文章进行建模。与以前的工作的不同之处在于在使用Attention发掘单词（或句子）的权重的时候，加入了一个上下文向量，这个上下文向量是随机初始化的，由模型自己去学习。以词级别的Attention为例，公式如下：
使用双向GRU生成每个句子的表示
Attention机制
如上图所示的公式中，
论文地址：https://www.cs.cmu.edu/~diyiy/docs/naacl16.pdf
代码实现：

阅读笔记：