《吴恩达深度学习》04卷积神经网络（第1周卷积神经网络）

最新推荐文章于 2022-08-16 16:27:31 发布

ZJ_Windy_Feng

最新推荐文章于 2022-08-16 16:27:31 发布

阅读量289

点赞数

分类专栏：深度学习理论学习

本文链接：https://blog.csdn.net/fzj0121/article/details/105649722

版权

15 篇文章 0 订阅

订阅专栏

04. 卷积神经网络

计算机视觉问题
（1）图像分类
（2）目标检测
（3）风格迁移
大规模图片上的深度学习
（1）以往的图片往往大小是 $64\times 64 \times 3$ 的，即总特征数为12288。
（2）若图片大小增加到 $1000 \times 1000 \times 3$ ，则总特征数增加到3百万。

计算机视觉问题
（1）人脸检测距离
垂直边缘检测
$\left[\begin{matrix} 3 & 0 & 1 & 2 & 7 & 4 \\ 1 & 5 & 8 & 9 & 3 & 1 \\ 2 & 7 & 2 & 5 & 1 & 3 \\ 0 & 1 & 3 & 1 & 7 & 8 \\ 4 & 2 & 1 & 6 & 2 & 8 \\ 2 & 4 & 5 & 2 & 3 & 9 \end{matrix}\right] * \left[\begin{matrix} 1 & 0 & -1\\ 1 & 0 & -1\\ 1 & 0 & -1 \end{matrix}\right] = \left[\begin{matrix} -5 & -4 & 0 & 8 \\ -10 & -2 & 2 & 3 \\ 0 & -2 & -4 & -7 \\ -3 & -2 & -3 & -16 \end{matrix} \right]$
编程实现
（1）python：conv_forward
（2）tensorflow：tf.nn.conv2d
垂直边缘检测的直观解释

Padding
（1）若有一张图片大小为 $\times n$ ，滤波器大小为 $\times f$ ，则卷积结果大小为 $(n-f+1)\times (n-f+1)$ 。
（2）缺点：每次卷积图像会变小；边角的像素只在一次卷积中涉及到，中部的像素点被多次采用。
（3）解决方法：在原始图像外围填充一圈像素点。设填充像素点个数为 $p$ ，则原始图像变为 $(n+2p)\times(n+2p)$ ，因此卷积结果大小变为 $(n+2p-f+1)\times(n+2p-f+1)$
Valid卷积和Same卷积
（1）Valid卷积：不填充
（2）Same卷积：填充，使得卷积结果和原始图像大小相同
通常情况下， $f$ 是奇数。

步幅卷积
（1）之前的卷积过程，步幅为1。
（2）若输入为 $\times n$ ，滤波器为 $\times f$ ，填充大小为 $p$ ，步幅为 $s$ ，则输出结果为 $\lfloor\frac{n+2p-f}{s}+1\rfloor \times \lfloor\frac{n+2p-f}{s}+1\rfloor$
互相关和卷积
机器学习（深度学习）领域中的卷积，和数学领域的卷积有所区别，和数学领域中的互相关更一致。
数学领域中的卷积运算，首先要对滤波器进行水平和垂直翻转，然后再进行计算。

RGB图像卷积
（1）原始图像尺寸：高 $\times$ 宽 $\times$ 通道数
（2）卷积核尺寸：高 $\times$ 宽 $\times$ 通道数（与原始图像相同）
（3）输出结果：高 $\times$ 宽（二维）
多过滤器
用于检测不同目标，如垂直边缘、水平边缘等。此时输出结果不再是二维的，和过滤器数量有关。

池化层的作用
（1）缩减模型大小
（2）提高计算速度
（3）提高所提取特征的鲁棒性
池化层：最大池化

上图中使用的过滤器的信息为： $f = 2$ ， $s = 2$ 。
平均池化（不常用）
池化层总结
（1）超参：常用的参数组有 $f = 2, s = 2$ 或 $f = 3, s = 2$ ，通常不使用padding
（2）若输入是 $n_H\times n_W\times n_C$ ，则输出是 $\lfloor\frac{n_H-f}{s}+1\rfloor \times \lfloor\frac{n_W-f}{s}+1\rfloor \times n_C$

示例总结

神经网络层	激活函数维度	激活函数规模	参数数量
输入	(32, 32,3)	3072	0
CONV1(f=5,s=1)	(28,28,8)	6272	208
POOL1(f=2,s=2)	(14,14,8)	1568	0
CONV2(f=5,s=1)	(10,10,16)	1600	416
POOL2(f=2,s=2)	(5, 5,16)	400	0
FC3	(120,1)	120	48001
FC4	(84,1)	84	10081
Softmax	(10,1)	10	841

为什么使用卷积？
（1）和全连接层相比，卷积层有两个优势，即参数共享和稀疏连接。
（2）参数共享：若特征检测器适用于图像的某个部分，则也很可能适用于其他部分。
（3）稀疏连接：在每一层，每个输出值仅和一小部分输入有关。
（4）卷积层善于捕捉平移不变。
总结
确定损失函数后，使用梯度下降等优化方法使损失函数最小。