对循环神经网络RNN的初步理解

最新推荐文章于 2024-03-31 11:15:51 发布

jancis

最新推荐文章于 2024-03-31 11:15:51 发布

阅读量775

点赞数 1

分类专栏：深度学习文章标签：神经网络

本文链接：https://blog.csdn.net/jancis/article/details/119033665

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

之前接触的都是医学图像上广泛使用的卷积神经网络，直到遇到心音的序列数据才刚刚开始使用循环神经网络，刚看的时候觉得与卷积神经网络的区别好大，输入输出怎么都搞不明白，看了一天，觉得稍微有那么点理解了，现在此小结一篇，不然我怕又忘了。

一、不同于CNN的地方：

CNN每一个与conv kernel 进行卷积的图像区域之间都是独立的，至少在卷积操作中是逐个进行滑窗卷积得到一个feature value的，然后组成一个feature map；而在RNN中，认为后面的序列跟前面的序列是有关系的，即后面一个sequence（序列）输入与前面一个sequence（序列）存在关系，首先前后sequence length必须保持一致（哪怕原本不一致，通过padding处理也要保持一致，因为网络结构一旦确定，输入形状就固定了），这里一个sequence就是由[x1,x2,x3,,,,,,,,,xm]组成的，x1可以是一个值（比如pcg信号的一个强度值），也可以是一个“单词”，但这个单词是要通过词嵌入方式的词向量表示的），即x1的形状可以是（1，），也可以是（特征维度数，）。在这里sequence length就等于m（在pcg信号中就可以是6000，表示将6000个采样点看作一个序列；而在自然语言中就可以是单词的个数，比如将5个单词认为是一个序列，那么sequence length就等于5）。

怎么表示出后面的序列与前面的序列有关系呢？可以看如下图所示：在t-1时刻输入的序列sequence length也应该是m，经过类似于全连接层的处理后得到隐藏层节点数n的输出节点数，即从m个节点到n个节点的全连接层处理（这里隐藏节点数像全连接层一样可以自定义），那么就得到了n个隐藏节点数的输出；这样一个序列就处理完毕了，其实就是简单的通过了一层的全连接层处理（对的，就是这么简单，不过也可以通过设置num_layers网络层数进行多个全连接层处理，默认是1层全连接层），接着处理下一个序列（也就到了t时刻），又拿一个sequence length等于m的序列进行全连接层的处理，但这时就要将上一个序列的n个隐藏节点输出应用到t时刻上：与输入序列一起进行权重相乘后相加的形式得到t时刻的n个隐藏节点输出，这样又一个序列就处理完毕了，其实就是又简单的通过了一层全连接层处理；然后又处理下一个序列（也就到了t+1时刻），如此循环。

简单的小结为每一个序列只经过一个简单的全连接层，不同于CNN的“深度”，RNN的深度由序列个数决定（--->）