发表于ACL2018
讽刺检测对于情感分析等任务非常重要,因为对于讽刺的句子往往会得出相反的情感结论。以往方法依赖LSTM等compositional模型,不利于句内词语关系的发现。本文认为讽刺的出现往往伴随某些相反极性的词语出现,因此建模词语间的关系非常重要。
模型:
首先过embedding layer得到word embedding,然后计算两两词语间的匹配度得到匹配矩阵,再对于每个词用max-pooling后得到匹配向量,softmax归一化后作为权重对整个句子加权平均得到句子表示。
上述表示没有compositional信息,本文再利用LSTM取最后的表征作为第二个表示。
将上述两个表示拼接,过全连接网络输出预测结果。
notes:
直接对word embedding计算相似度矩阵而不是先过LSTM再计算,因为LSTM后可能导致相邻词语表征非常相近,即使他们原本是反义词。直接对word embedding计算相似度能更好捕捉词语原来的关系。