B站学习法之深度学习笔记一

最新推荐文章于 2023-06-08 20:23:00 发布

NERV_Dyson

最新推荐文章于 2023-06-08 20:23:00 发布

阅读量2.5k

点赞数 1

分类专栏： B站文章标签：语音识别；Deep learning;B站学习

本文链接：https://blog.csdn.net/qq_38382642/article/details/89765469

版权

本文是B站学习法的深度学习笔记第一部分，重点介绍了全连接层（Fully Connected Layer）和循环结构（Recurrent Structure）。全连接层通过卷积将特征整合，减少了位置对分类的影响。接着，文章详细讲解了RNN、Deep RNN、双向RNN、金字塔RNN以及LSTM和GRU的结构和工作原理，帮助理解如何处理序列数据。

摘要由CSDN通过智能技术生成

B站学习法之深度学习笔记一

Three Steps for Deep Learning

Three Steps for Deep Learning

Step 1. A neural network is a function compose of simple functions (neurons)
神经元=simple fcn
神经网络=fcn
通常需要自己决定网络的structure,and let machine find parameters from data.
所以我们要focused 就是有哪些常见的structure.
Step 2. 定好structure和para后就要定cost function——什么样的network参数是好的？什么样的network的参数又是不好的？那么如何定cost fcn呢？
那当然是case by case，取决于你要处理的问题和你手上的data（训练数据）
Step 3. 有了上面两个步骤之后，我们就用gradient descent(梯度下降）找到一个最好的fcn

接下来开头课程的outline

在这里插入图片描述

1.Fully connected layer(全连接层)

1.1关于全连接层的浅显理解

对全连接层的理解参考了这篇原创文章[link]https://blog.csdn.net/m0_37407756/article/details/80904580
理解：例如经过卷积，relu后得到3x3x5的输出。
那它是怎么样把3x3x5的输出，转换成1x4096的形式？
在这里插入图片描述
很简单,可以理解为在中间做了一个卷积。

在这里插入图片描述
从上图我们可以看出，我们用一个3x3x5的filter 去卷积激活函数的输出，得到的结果就是一个fully connected layer 的一个神经元的输出，这个输出就是一个值。因为我们有4096个神经元。我们实际就是用一个3x3x5x4096的卷积层去卷积激活函数的输出。

以VGG-16再举个例子吧，

对224x224x3的输入，最后一层卷积可得输出为7x7x512，如后层是一层含4096个神经元的FC，则可用卷积核为7x7x512x4096的全局卷积来实现这一全连接运算过程。

它把特征representation整合到一起，输出为一个值。

那么全连接层这样做,有什么好处？
好处就是大大减少特征位置对分类带来的影响，不能理解？没关系，继续举例理解：
举个简单的例子：
在这里插入图片描述
从上图我们可以看出，猫在不同的位置，输出的feature值相同，但是位置不同。

对于电脑来说，特征值相同，但是特征值位置不同，那分类结果也可能不一样。所以为了避免上图中Feature Map的位置不同引起电脑分类不一样的后果，全连接层filter的作用就相当于告诉电脑——

喵在哪我不管，我只要喵，于是我让filter去把这个喵找到，实际就是把Feature map 整合成一个值，这个值大，有喵，这个值小，那就可能没喵，和这个喵在哪关系不大了，鲁棒性有大大增强。

在实际使用当中，全连接层中一层的一个神经元可以看成一个多项式，我们用许多神经元去拟合数据分布。但是只用一层fully connected layer 有时候没法解决非线性问题，那么如果有两层或以上fully connected layer就可以很好地解决非线性问题了

再举一个例子说明很好地解决非线性问题：
我们都知道，全连接层之前的作用是提取特征

全连接层的作用是分类

我们现在的任务是去区别一图片是不是猫
在这里插入图片描述
假设现在神经网络模型已经训练完了，全连接层已经知道了，并表示：当我们检测到以下特征时，我就可以判断这个东东是猫了。
因为全连接层的作用主要就是实现分类（Classification）

从下图，我们可以看出
在这里插入图片描述
红色的神经元表示这个特征被找到了（激活了）
同一层的其他神经元，要么猫的特征不明显，要么没找到
当我们把这些找到的特征组合在一起后发现最符合要求的是猫——ok，我认为这是猫了。

再比如说区别猫头：
在这里插入图片描述
道理和区别猫一样
当我们找到这些特征，神经元就被激活了（上图红色圆圈）

注：这些细节特征又是怎么来的？——是从前面的卷积层，下采样层来的

全连接层参数特多（可占整个网络参数80%左右），那么全连接层对模型影响参数就是三个：

全连接层的总层数（长度）
单个全连接层的神经元数（宽度）
激活函数
其中，激活函数暂时先明白他的作用是

以上，从全连接层的好处（减少特征位置对分类带来的影响）+全连接层的作用（分类）+全连接层对模型影响的主要参数进行了十分浅显且不知道恰不恰当的举例，对Fully connected layer有了粗浅的了解。

1.2关于全连接层的浅显理解

第 $l$ 层有N个Nodes,均对用一个output: $a^l_i$ ,其中 $i$ 代表第 $l$ 层的第 $i$ 个神经元的输出
把一层layer中的所有output集合起来——就组成了一个vector向量，用 $a^l$ 代表第 $l$ 层的输出向量。
在这里插入图片描述

FCL中的每个layer都是两两相接的，那neurons和neurons之间的connection有一个weight—— $w^l_{ij}$
其中，上标表示这个连接了第l-1个layer和第l个Layer；下标是指这个weight连接了第 $l - 1$ 个layer的第 $j$ 个neuron $a_j$ 连接到（箭头指向）第 $l$ 个layer的第 $i$ 个neuron.( $j$ 在左边， $i$ 在右边）
在这里插入图片描述

    依次类推，两两neurons之间就有一个weight，由此排成一个矩阵 $W^l$ .第一个index(即 $i$ )指的是row,第二个index(即 $j$ )指的是column.从而 $W^l$ 的row行的个数就是 $N_l$ (节点数）， $W^l$ 的column列的个数就是 $N_{l-1}$ (节点数）
（注：第一个index指的是上图的input layer,第二个index指的是上图的output layer）
在这里插入图片描述
    那么，现在就构造了一个matrix将所有的weight全都表示。上标 $l$ 表示第 $l - 1$ 和第 $l$ 层的weight_matrix.
    除了weight以外，每个neuron还有一个bias.（我们可以把bias想象成weight的一部分，只是需要在input的地方多加一个1（如下图所示的1，并将1视为是weight的一部分），所以有些书就没有给出bias图线的部分）将这些bias全部穿起来成一个vector,用 $b^l$ 表示第 $l$ 个layer组成的bias的vector.
在这里插入图片描述
接下来我们要算 $a^l_i$ ,即第 $l$ 个layer的第 $i$ 个neuron的output $a^l_i$

最低0.47元/天解锁文章

NERV_Dyson

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
B站学习法之深度学习笔记一

B站学习法之深度学习笔记一Three Steps for Deep Learning接下来开头课程的outline1.Fully connected layer(全连接层)1.1关于全连接层的浅显理解1.2关于全连接层的浅显理解合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一...
复制链接

扫一扫

专栏目录