填充（Padding）是卷积神经网络（CNN）中一种技术，填充的主要目的是

six.学长

于 2024-06-24 10:17:22 发布

阅读量785

点赞数 10

分类专栏：深度学习机器学习文章标签： cnn 人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51200050/article/details/139917793

版权

深度学习同时被 2 个专栏收录

63 篇文章 1 订阅

订阅专栏

31 篇文章 1 订阅

订阅专栏

填充（Padding）是卷积神经网络（CNN）中一种技术，通过在输入特征图的边缘添加像素，以控制输出特征图的空间维度。填充的主要目的是：

控制输出大小：通过填充可以在一定程度上保留输入特征图的边缘信息，从而控制输出特征图的空间维度。
保留边界信息：在没有填充的情况下，卷积操作会导致输出特征图的尺寸逐渐减小，导致边界信息丢失。填充有助于缓解这个问题。
保持输入输出尺寸一致：有时希望卷积后的特征图与输入特征图保持相同的尺寸，填充可以帮助实现这一目的。

填充的类型

有效填充（Valid Padding）：
- 也称为"不填充"（No Padding）。
- 卷积操作不会在输入特征图的边缘添加任何额外的像素。
- 输出特征图的尺寸会随着卷积操作逐渐减小。
相同填充（Same Padding）：
- 也称为"填充"（Padding）。
- 在输入特征图的边缘添加适当数量的像素，使得输出特征图的尺寸与输入特征图相同。
- 填充的大小由卷积核的尺寸和步长决定。

填充大小的计算

假设输入特征图的尺寸为 $H_{\text{in}} \times W_{\text{in}}$ ，卷积核的大小为 $k_H \times k_W$ ，步长为 $s_H \times s_W$ ，输出特征图的尺寸为 $H_{\text{out}} \times W_{\text{out}}$ ，填充的大小为 $p_H \times p_W$ 。计算填充大小的一般公式如下：

对于高度方向的填充：
$p_H = \left\lfloor \frac{(H_{\text{out}} - 1) \times s_H + k_H - H_{\text{in}}}{2} \right\rfloor$

对于宽度方向的填充：
$p_W = \left\lfloor \frac{(W_{\text{out}} - 1) \times s_W + k_W - W_{\text{in}}}{2} \right\rfloor$

在实际应用中，常用以下公式简化填充计算：

$p_H = \left\lfloor \frac{k_H - 1}{2} \right\rfloor$

$p_W = \left\lfloor \frac{k_W - 1}{2} \right\rfloor$

例子

假设输入特征图尺寸为 $28 \times 28$ ，卷积核大小为 $\times 3$ ，步长为 $\times 1$ ，使用相同填充。根据公式计算填充大小：

$p_H = p_W = \left\lfloor \frac{3 - 1}{2} \right\rfloor = 1$

因此，在输入特征图的四边各添加一列像素，填充后的输入特征图尺寸变为 $30 \times 30$ ，经过卷积操作后，输出特征图的尺寸仍然为 $28 \times 28$ 。

关注

10
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。