LSTM GRU CNN Seq2seq知识点概要

最新推荐文章于 2024-07-31 13:01:45 发布

知了不知蝉鸣惊

最新推荐文章于 2024-07-31 13:01:45 发布

阅读量864

点赞数

分类专栏：深度学习算法文章标签： cnn rnn

本文链接：https://blog.csdn.net/promisejia/article/details/88567450

版权

深度学习算法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1. RNN 循环神经网络

rnn的优点和缺点

优点：

能方便地对建立一个序列化进行建模。
具有短期记忆功能。
缺点：
由于反向传播，梯度值在经过每个时间步的传播时会呈现指数级的收缩，最终导致梯度弥散问题，这样最前面一层的参数没有被优化。

rnn cell示意图及 rnn

在这里插入图片描述

2. LSTM 长短时记忆网络

画图和公式

在这里插入图片描述

决定忘记（forget）信息： $f_t = sigmoid[W _f(h_t-1,x_t)+b] * (C_{t-1})$
确定更新的信息：
- 第一，sigmoid 层 (“输入门层(input))” 决定候选层中的哪些加入细胞状态: $i_t = sigmoid[W_i (h_{t-1},x_t)+b_i]$
- 然后，一个 tanh 层(侯选层)创建一个新的候选值向量，这是加入细胞状态的候选信息: $r_t =tanh(W_r(h_{t-1},x_t)+b_r)$
更新细胞状态：忘记 + 更新的 $C_t = C_{t-1}*f_t + i_t *r_t$
输出(output)信息： $h_t =o_t * tanh(C_t)$ 其中，输出门 $o_t = sigmoid[W_o (h_t-1,x_t)+b_o]$

RNN与LSTM

rnn只能进行短期记忆
lstm 由于遗忘门和细胞状态的存在，可以选择遗忘或保留某些信息，客服了rnn不能记忆长期信息的缺点。更具体地，LSTM的cell信息是通过输入们控制之后累加的，而rnn是累乘，因此再反向传播的过程中容易梯度弥散。

3. GRU网络

3.1 公式

在这里插入图片描述
更新门： $u_t = \sigma(W_u(h_{t-1},x_t)+b_t)$ 决定了最后要忘记哪些信息以及哪些新信息需要被添加
重置门： $r_t = \sigma(W_r(h_{t-1},x_t)+b_r)$ 重置门用于决定遗忘先前信息的程度
tanh: $\hat{h}_t = tanh(W_h(h_{t-1}*r_t,x_t))$
输出： $h_t = (1-u_t) *h_{t-1} + u_t * \hat{h}_t$

3.2 GRU网络和LSTM网络的比较

gru中有 更新门和重置门 两个门，一个tanh层；而Lstm有遗忘门、输入门和输出门三个门，两个tanh层，在结构上，gru比lstm简单，计算复杂的低，收敛快；
但在效果上不一定，应用实验选择一种好的效果。

4. CNN网络知识

权重参数个数：

卷积层的参数个数只与卷积核的大小和卷积核个数有关，在加上个偏置b参数： $kernel_size * conv_num + 1$ ；注意：池化层权重参数为0；

卷积后隐藏层的size：

$out_size = [(input_size - filter_size + 2*padding_flag）/stride] + 1$ ；配合卷积向下取整，池化向上取整,padding 取0、1、2等；

卷积feature map不变的配置：

stride = 1，kernel = 3 padding = 1 或 kernel = 5， padding = 2

padding的same和valid：

在tensorflow中，same方式会padding 0方式补全； valid会直接drop一些特征。

池化层的作用

聚合和压缩特征，减少运算复杂度
有一定的扛干扰能力，最大池化的特点决定，只选最大那个

卷积的特点/为何用卷积/卷积神经网络的特点

局部感知：卷积提取的特征更多关注局部，然后再更高成将局部信息进行整合
权重共享：减少了运算量
多卷积核：多卷积核减少对事物的偏见
最大池化降维

卷积神经网络常用的激活函数

sigmoid和tanh在激活时，-更加关注数据在0中心的细小变化，而忽略数据的极端变化，relu可以关注这些变化；
relu：避免梯度弥散，收敛快，求梯度简单，但比较脆弱。
可以使用LRN(通过局部归一化，被激活的神经元抑制相邻神经元，起到增加泛化性的作用),对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。
bn算法，每一轮更新完数据后都归一化。