CNN基础小记

最新推荐文章于 2024-05-30 19:32:25 发布

ferb2015

最新推荐文章于 2024-05-30 19:32:25 发布

阅读量442

点赞数

分类专栏：深度学习文章标签： CNN

本文链接：https://blog.csdn.net/eqiang8848/article/details/89671995

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

CNN利用空间关系减少需要学习的参数数目以提高一般前向BP算法的训练性能。

卷积神经网络是一个多层的神经网络，每层由多个二维平面组成，而每个平面由多个独立神经元组成。

卷积网络的核心思想是将：局部感受野、权值共享（或者权值复制）以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。

我们训练一个神经网络，就是要训练得出这些卷积核，而这些卷积核就相当于我们学单层感知器的时候的那些参数W，因此你可以把这些待学习的卷积核看成是神经网络的训练参数W。

卷积神经网络最常见的形式就是将一些卷积层和ReLU层放在一起，其后紧跟汇聚层，然后重复如此直到图像在空间上被缩小到一个足够小的尺寸，在某个地方过渡成成全连接层也较为常见。最后的全连接层得到输出，比如分类评分等

滤波器filter = 卷积核kernel == 权重矩阵

卷积核做的，其实就是与感受野范围内的像素点进行点积（而不是矩阵乘法）。

Feature Map 特征图

输入和滤波器卷积后的输出叫特征图。
https://blog.csdn.net/zouxy09/article/details/8781543
每种滤波器去卷积图像就得到对图像的不同特征的映射，即输出层。100个滤波器（卷积核）就有100个Feature Map（深度）

卷积神经网络计算原理

输出数据体在空间上的尺寸可以通过输入数据体尺寸（W），卷积层中神经元的感受野尺寸（F），步长（S）和零填充的数量（P）的函数来计算。（译者注：这里假设输入数组的空间形状是正方形，即高度和宽度相等）输出数据体（特征图）的空间尺寸为(W-F +2P)/S+1。

当步长S=1时，零填充的值是P=(F-1)/2（不用记）

卷积输出的feature map的大小的计算

大小：(W-F +2P)/S+1
比如：iput：3 *32 *32，filter：3 *5 *5，bias：1，feature map：1 *28 *28.
哪里WX+b？？

参考https://zhuanlan.zhihu.com/p/29119239、https://blog.csdn.net/dcrmg/article/details/79652487

以 AlexNet 模型的第一个卷积层为例，

 输入图片的尺寸统一为 227 x 227 x 3 （高度 x 宽度 x 颜色通道数），
 本层一共具有96个卷积核，
 每个卷积核的尺寸都是 11 x 11 x 3。
 已知 stride = 4， padding = 0，
 假设 batch_size = 256，
 则输出矩阵的高度/宽度为 (227 - 11) / 4 + 1 = 55

alexnet	batch	height	weight	in depth	out depth
input	256 *	227 *	227 *	3
kernel		11 *	11 *	3 *	96
output	256 *	55 *	55 *		96

深度切片：就是特征图数量（out depth）。深度切片中的所有权重都使用同一个权重向量，用同一个滤波器去扫描

全连接

每个隐层神经元都连接图像的每一个像素点。最后一层滤波器尺寸等于输入尺寸，所以输出就是1*1*N了。（比如针对第一个连接区域是[7x7x512]的全连接层，令其滤波器尺寸为F=7，这样输出数据体就为[1x1x4096]了。）

然而图像的空间联系是局部的，就像人是通过一个局部的感受野去感受外界图像一样，每一个神经元都不需要对全局图像做感受，每个神经元只感受局部的图像区域，然后在更高层，将这些感受不同局部的神经元综合起来就可以得到全局的信息了。这样，我们就可以减少连接的数目，也就是减少神经网络需要训练的权值参数的个数了。（神经元，理解为权重W）

lenet5网络卷积、池化、relu、fc层的计算规则

参考https://blog.csdn.net/d5224/article/details/68928083、https://www.jianshu.com/p/ce609f9b5910

网络一共有多少神经元、存在多少连接和参数

参考https://blog.csdn.net/qq_35608277/article/details/79032842

对于一个卷积神经网络，假如该网络的第k层有n个节点，k+1层为卷积层且有m个节点，则k+1层的每个节点只与k层的部分节点相连，此处假设只与k层的i个节点相连（局部连接）；另外k+1层的每个节点的连接共享相同的参数、相同的bias（参数共享）。这样该卷积神经网络的第k、k+1层间共有m*i个连接、i+1个参数。由于i小于n且为常数，所以卷积层的连接数、参数数量的数量级约为O(n)，远小于全连接的O(n^2)的数量级。

连接的参数矩阵：就是卷积核的意思（权重矩阵）

连接参数：就是卷积核参数，比如卷积核有5x5个连接参数。

训练参数（神经元个数）：（要更新的参数（variable））（连接参数加上1个偏置参数）* 特征图数量。比如共25+1=26个训练参数，有6个特征图，训练参数共有26 * 6个。

连接：特征图输出大小 * 训练参数。比如每个特征图输出大小为28 * 28.则有(5 * 5 + 1) * 6 * 28 * 28个连接。

feature map中神经元个数：特征图大小 * 深度。比如6个卷积核，就有6个特征图，特征图大小28 * 28，则神经元个数为28 *28 *6=784。