主要内容
一个事件被分为几个包含多个帖子的子事件,每个帖子被进一步分割为几个单词,实现了将事件进行结构化表示。将结构化的事件用双向LSTM进行学习,引入注意力机制。
实验模型
- 对文本结构进行分层:将事件中的帖子分成不同的时间间隔,每个时间间隔可认为是一个子事件;子事件由多条帖子构成;每条帖子由多个词语构成
- 提取了22个社会特征
模型结构(如下图)
- 单层LSTM只能学习到前边的上下文,双向LSTM可以学习前后的上下文
- 词级部分:双向LSTM+注意层
- 帖子部分:双向LSTM+社会特征注意层
- 子事件部分:双向LSTM+社会特征注意层
实验部分
数据集
Majing的公开数据集
实验结果