《Exploiting Document Knowledge for Aspect-level Sentiment Classification》
这是一篇比较火的文章。
它的思想是,基于主题的情感分析的标签不好搞,尤其是主题,主题这个东西本身就不好得到,所以数据集都会很少。而迁移学习可以带来文档级别的情感分析中的知识,所以能提升效果。
模型的结构也不复杂。
Glove(embedding)
LSTM ATT
dense
softmax
方法是,首先在文档级别的文本中进行训练,
再用基于主题的进行fine-tuning.
最后训练好了之后文档级别和基于主题级别会共同的使用LSTM和embedding,然后共同训练,两个损失函数相加。
在这个过程中,作者成功的取了20%的训练数据,80%的剩余数据,这是一个挺有意思的部分。损失方程的相加方法,dropout的比率,损失函数的选择。
评价:
这个过程中,fine-tuning的信息主要保存在了LSTM中,保存在LSTM的参数中。
transfer是非常有帮助的一个东西
这篇论文十分经典