情感分类属于文本分类的一个应用场景,一般都是人(用户)对某些具体事物(商品、事件)表达某些情感。落地场景是很多的。这学期最开始是做stance detection相关的工作,而其中target-specific stance detection和情感分类中的aspect-based sentiment analysis是很相关的,而AIC的比赛又正好是这个后者,所以顺便调研了下sentiment analysis。在此列出读论文的列表,部分论文直接列出一些简单的笔记,这些论文可读性不强(方法过于简单,或者论文本身的贡献不在方法上,没有太多记录成笔记的价值…),部分论文会逐步完善,给出简单的阅读笔记。阅读价值评分纯粹是基于自己对于文章的理解,标准包括:动机、方法、数据集质量、实验安排、相关工作等,满分为5(相对评分,即分值高低仅反映论文在以下列表中的可读价值,并不一定说明这篇文章有多好)。列表如下:
名称 | 所属会议(来源) | 类型 | 时间 | 阅读价值 | 笔记 |
---|---|---|---|---|---|
Deep Learning for Sentiment Analysis: A Survey | 2018 | 5 | Survey | ||
Deep Memory Networks for Attitude Identification | WSDM | long paper | 2017 | 3.5 | attitude identification,感觉和aspect情感分类差不多,都有target对象。本文通过memory network联合建模了target识别、情感分类两个任务。在情感分类、stance detection、debate数据集上取得了较好效果。模型图画得很复杂,其实结构是很直观的。相当于先识别target(找到相关表述),再将该部分输出作为情感分类模块的输入。target和两个模块中的计算都进行了attention的交互。可以参看该文的参考文献。 |
User modeling with neural network for review rating prediction | IJCAI | long paper | 2015 | 3 | 哈工大的工作,直接看该组在同年ACL的文章即可,是该篇加强版 |
End-to-end adversarial memory network for cross-domain sentiment classification | IJCAI | long paper | 2017 | 4 | 情感分类中的迁移学习。本文重点是找pivot,即在不同domain中都常出现的表达情感的词。通过设置memory network,使得模型能够捕捉重点词。通过设置情感分类和domain分类两个网络,并设置对抗学习目标。两个模型在共享权重的前提下,情感分类侧重区分情感(数据为source domain的labeled data),domain分类通过引入GRL来使模型混淆无法区分domain,从而学习到domain-transferable的特征表示(数据来自两个domain的unlabeled data)。无论动机、模型还是最后的实验结果、分析,本文都十分出色。值得多多参考学习。 |
A |