文章目录
Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks
论文核心
是使用LSTM表征句法结构树,他的出发点是对序列形式的句法表征的改进,是希望使用LSTM表示句法结构树下的句子表征。(句法结构树不同短语依存树)
模型结构在句子相似度评测和情感分类中被测试。
背景:LSTM变体
1 双向LSTM
正序下的LSTM和倒序下的LSTM
2 多层LSTM
更上层的LSTM能够捕捉更长的句法依赖。
3 标准的LSTM结构
input gate ,forget gate,output gate,cell, hidden state
模型结构
1 child_sum_Tree LSTM
注意是,hj的计算方法变了。
2 N-ary_Tree LSTM
U 类似于权重项
训练——具体的任务
在句子对的相似度评价任务中,,计算方法
h_L表示句子对中的左边句子,h_R表示句子对中的右边句子。