本文结构:
四个问题
- 每个问题是什么
- 应用什么模型
- 模型效果
CS224d-Day 11:
Recursive neural networks – for different tasks (e.g. sentiment analysis)
课程链接
视频链接
课件链接
四个问题
这次课主要讲了标准的 Recursive neural networks 模型及其扩展模型在3个问题上的应用和效果,最后的 Tree LSTM 简单地介绍了模型和效果。
这3个问题分别是 Paraphrase detection,Relation classification,Sentiment Analysis。
每个模型都可以应用到任意一个问题上,只不过效果不同,有些模型对一些问题表现会更优一些。
1.Paraphrase detection
目的是判断两句话是否具有相同的意思
用到的模型是标准的RNN
为了解决这个问题,需要思考:
怎样比较两个句子?
通过成对地比较两个句子的短语,这个时候可以用 standard RNN,因为它可以得到一个合理的树结构,也就是句子的短语组成结构。
怎样用相似度来判断两个句子的意义是一样的?
如果用两个树结构的顶点去判断,那会丢掉很多中间环节的信息。
如果只计数两个句子中相似短语的个数,那么会丢掉位置信息,即这些短语出现在什么位置。
所以用 similar ma