发表时间2019年9月
1.纯用的是attention机制。
2.用上了BERT机制
3.用上了一个叫 label unreliability issue和 label smoothing regularization
提出2016年tang和dong的工作,其实都是为了处理一个将target信息加入到低维空间中的问题。
认为neutral这个标签,都有些碍事儿了。
也关注target和sentiment之间的互相关系和内在关系。
pre-trained Bert
模型也很轻便?