CH10 卷积神经网络

最新推荐文章于 2024-07-21 07:50:37 发布

Jin4869

最新推荐文章于 2024-07-21 07:50:37 发布

阅读量127

点赞数

分类专栏：机器学习文章标签： cnn 深度学习神经网络

本文链接：https://blog.csdn.net/Jin4869/article/details/128391850

版权

12 篇文章 1 订阅

订阅专栏

左边

数据输入层，对数据做一些处理，比如去均值（把输入数据各个维度都中心化为0，避免数据过多偏差，影响训练效果）、归一化（把所有的数据都归一到同样的范围）、PCA/白化等等。

中间

右边

组成成分：

卷积：卷积核在图片上滑动，计算点积
（28 = 32 - 5 + 1）

3:一般channel的维度和image保持一致
在这里插入图片描述

在这里插入图片描述

输入矩阵，核矩阵可以由多个相同的矩阵叠加在一起

比如图像通常有3个通道（Channel），分别代表红黄蓝

如果输入通道数为c1，输出通道数为c2，则共需要c1*c2个核矩阵

在这里插入图片描述

4:左上角的九宫格与filter做内积
4 = $3 * 1 + 1 * 0 + 2 * - 1 + 1 * 1 + 1 * - 1 + 1 * 3 + 1 * 0 + 3 * 1 + 1 * - 1$
其他类似，最后结果2*2

在这里插入图片描述

输出大小公式：
$(N - F + 2 P) / s t r i d e + 1$

N：image宽度
F：filter宽度
P：padding，填充，在输入特征图的每一边添加一定数目的行列，使得输出的特征图的长、宽 = 输入的特征图的长、宽
- 目的：希望每个输入方块都能作为卷积窗口的中心
stride：步幅，卷积核经过输入特征图的采样间隔
- 目的：希望减小输入参数的数目，减少计算量
- 作用：成倍缩小尺寸，比如步幅为2，输出就是输入的1/2（不严谨的1/2）