1、为什么需要递归神经网络?
- RNN可以考虑上下文关系,语序
- RNN可以减少参数量,减少模型复杂度
- 可以处理不同时长的数据
2、Recurrent Neural Network——递归神经网络
2.1 构造语言模型
2.2 对于情感分析只需要在最后时刻将rnn cell的输出接入一个softmax
2.3 RNN formulation
线性的转换+非线性激活函数
2.4 RNN vs HMM
在hmm中,每一个时刻只有一个状态被激活。RNN每个时刻的每个状态都是一个连续性的随机变量——分布式表示方法。深度学习基本都是分布式的表示方法
one- hot encoding:
- sparse
- 不需要学习
- 状态转移矩阵会非常大
distributed representation - non-sparse/compact
- 需要训练学习
3、Recap:语言模型
4、RNN的语言模型
-
1、先对每一个word做word embedding
-
2、输入rnn cell
-
3、输出每个时刻的output
-
4、y输出的是给定当前单词,下一个单词出现的概率分布
-
5、针对一个sentence,损失函数是每个时刻loss的叠加