58 深层循环神经网络【动手学深度学习v2】
深度学习学习笔记
学习视频:https://www.bilibili.com/video/BV1JM4y1T7N4/?spm_id_from=autoNext&vd_source=75dce036dc8244310435eaf03de4e330
RNN 只有一个隐藏变量,一个隐藏层,做深层则多加几个隐藏层。
往右箭头是到下一个时间步,隐藏层的状态既往上有往右,上一个隐藏层的隐藏状态作为输出,最后对最后一层的隐藏状态做一个全连接作为一个输出。
深度循环网络使用多个隐藏层来获得更多非线性。
QA:
- H 又作为上一层的隐藏层的输入,又作为下一个时间的隐藏层的输入。
- nlp 文本翻译方面已经很成熟了
- 深层RNN,每一层都需要一个初始隐藏状态