Coursera Deeplearning.ai「深度学习」课程笔记L4.W1卷积神经网络

最新推荐文章于 2024-08-11 02:00:50 发布

XLearning88

最新推荐文章于 2024-08-11 02:00:50 发布

阅读量217

点赞数

分类专栏：吴恩达deeplearning机器学习笔记文章标签：机器学习吴恩达深度学习

本文链接：https://blog.csdn.net/XLearning88/article/details/89949314

版权

吴恩达deeplearning机器学习笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

卷积神经网络

1 - 边缘检测 & 过滤器
2 - Padding(填充)
- 2.1 - Valid卷积
- 2.2 - Same卷积
3 - 步长(strided convolutions)
4 - 卷积神经网络中的各种标记
5 - 池化层(pooling layers)

1 - 边缘检测 & 过滤器

1.1 - 过滤器类别

一般过滤器

$\begin{bmatrix} 1 & 0 & -1\\ 1 & 0 & -1\\ 1 & 0 & -1 \end{bmatrix}$

Sobel过滤器

$\begin{bmatrix}1 & 0 & - 1 \\ 2 & 0 & - 2 \\ 1 & 0 & - 1 \end{bmatrix}$

Scharr过滤器

$\begin{bmatrix} 3& 0 & - 3 \\ 10 & 0 & - 10 \\ 3 & 0 & - 3 \end{bmatrix}$

1.2 - 编程中的卷积(convolution)

不同的编程语言有不同的函数，而不是用“ $*$ ”来表示卷积。所以在编程练习中，你会使用一个叫conv_forward的函数。如果在tensorflow下，这个函数叫tf.conv2d。在其他深度学习框架中，在后面的课程中，你将会看到Keras这个框架，在这个框架下用Conv2D实现卷积运算。所有的编程框架都有一些函数来实现卷积运算。

2 - Padding(填充)

如果有一个 $n \times n$ 的图像，用一个 $f \times f$ 的过滤器卷积，输出的图像是 $(n - f + 1) \times (n - f + 1)$ 维。

2.1 - Valid卷积

在没有填充的情况下进行卷积，也就是输出的图像是 $(n - f + 1) \times (n - f + 1)$ 维

2.2 - Same卷积

假设填充 $p$ 个像素点，那么 $p = (f - 1) / 2$ 。

习惯上，计算机视觉中， $f$ 通常是奇数

3 - 步长(strided convolutions)

如果有一个 $n \times n$ 的矩阵或者 $n \times n$ 的图像，与一个 $f \times f$ 的矩阵卷积（过滤器）。Padding是 $p$ ，步幅是 $s$ ，那么卷积后的维度是
$⌊\frac{n + 2p - f}{s}+1⌋\times⌊\frac{n + 2p - f}{s}+1⌋$ ，其中 $⌊ \cdot ⌋$ 表示的是向下取整（floor）。

4 - 卷积神经网络中的各种标记

以 $l$ 层为例

$f^{[l]}$ = 过滤器大小 (filter size)
$p^{[l]}$ = padding的数量
$s^{[l]}$ = 步幅
$n_{c}^{[l]}$ = 过滤器数量
下标H、W、c分别表示图片的高度、宽度和通道数(深度)

输入： $n_{H}^{\left\lbrack l - 1 \right\rbrack} \times n_{W}^{\left\lbrack l - 1 \right\rbrack} \times n_{c}^{\left\lbrack l - 1\right\rbrack}$ (即上一层的激活值)

输出： $n_{H}^{[l]} \times n_{W}^{[l]} \times n_{c}^{[l]}$

过滤器： $f^{[l]} \times f^{[l]} \times n_{c}^{\left\lbrack l - 1 \right\rbrack}$

根据输入和过滤器及padding、步幅等，可以计算出：

$n_{H}^{[l]} = \lfloor\frac{n_{H}^{\left\lbrack l - 1 \right\rbrack} +2p^{[l]} - f^{[l]}}{s^{[l]}} +1\rfloor$

$n_{W}^{[l]} = \lfloor\frac{n_{W}^{\left\lbrack l - 1 \right\rbrack} +2p^{[l]} - f^{[l]}}{s^{[l]}} +1\rfloor$

激活值 $a^{[l]}$ ： $n_{H}^{[l]} \times n_{W}^{[l]} \times n_{c}^{[l]}$

权重参数 $W$ ： $f^{[l]} \times f^{[l]} \times n_{c}^{[l - 1]} \times n_{c}^{[l]}$

偏差参数 $b$ ： $1×1×1×n_{c}^{[l]}$

5 - 池化层(pooling layers)

最大池化的输出大小： $\lfloor\frac{n + 2p - f}{s} + 1\rfloor$
池化的超级参数包括过滤器大小 $f$ 和步幅 $s$ ，常用的参数值为 $f = 2$ ， $s = 2$ ，应用频率非常高，其效果相当于高度和宽度缩减一半。也有使用 $f = 2$ ， $s = 2$ 的情况。
最大池化时，大部分情况下很少用padding。目前 $p$ 最常用的值是0，即 $p = 0$ 。
最大池化的输入就是 $n_{H} \times n_{W} \times n_{c}$ ，假设没有padding，则输出 $\lfloor\frac{n_{H} - f}{s} +1\rfloor \times \lfloor\frac{n_{w} - f}{s} + 1\rfloor \times n_{c}$ 。
需要注意的一点是，池化过程中没有需要学习的参数。执行反向传播时，反向传播没有参数适用于最大池化。只有这些设置过的超参数，可能是手动设置的，也可能是通过交叉验证设置的。

XLearning88

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Coursera Deeplearning.ai「深度学习」课程笔记L4.W1卷积神经网络

卷积神经网络1 - 边缘检测 & 过滤器1.1 - 过滤器类别一般过滤器Sobel过滤器Scharr过滤器1.2 - 编程中的卷积(convolution)2 - Padding(填充)2.1 - Valid卷积2.2 - Same卷积3 - 步长(strided convolutions)4 - 卷积神经网络中的各种标记5 - 池化层(pooling layers)1 - 边缘检测 &...
复制链接

扫一扫

专栏目录