深度学习笔记（22） Padding

LeonDL168

于 2024-08-16 09:04:50 发布

阅读量34

点赞数

分类专栏：深度学习文章标签：深度学习笔记人工智能

原文链接：https://joveh-h.blog.csdn.net/article/details/91129385

版权

深度学习专栏收录该内容

100 篇文章 2 订阅

订阅专栏

深度学习笔记（22） Padding

1. 卷积的缺陷
2. Padding
3. Valid卷积
4. Same卷积
5. 奇数的过滤器

1. 卷积的缺陷

为了构建深度神经网络，需要学会使用的一个基本的卷积操作就是padding

如果用一个3×3的过滤器卷积一个6×6的图像
最后会得到一个4×4的输出，也就是一个4×4矩阵
那是因为3×3过滤器在6×6矩阵中，只可能有4×4种可能的位置
这背后的数学解释是，如果有一个

n × n n×n

$n \times n$ 的图像，用

f × f f×f

$f \times f$ 的过滤器做卷积
那么输出的维度就是：

( n − f + 1 ) × ( n − f + 1 ) (n-f+1)×(n-f+1)

$(n - f + 1) \times (n - f + 1)$

在这个例子里是 6-3+1=4，因此得到了一个4×4的输出

上述的Padding有两个缺点：

每次做卷积操作，图像就会缩小
从6×6缩小到4×4，可能做了几次之后，就会变得很小了，可能1×1的大小
图像边缘的大部分信息都丢失
那些在角落或者边缘区域的像素点在输出中采用较少

2. Padding

为了解决这些问题，可以在卷积操作之前填充这幅图像

在这个案例中，可以沿着图像边缘再填充一层像素
那么6×6的图像就被填充成了一个8×8的图像
如果用3×3的图像对这个8×8的图像卷积，得到的输出是6×6的图像
就得到了一个尺寸和原始图像相同的图像

在这里插入图片描述
习惯上，可以用0去填充，如果p是填充的数量，在这个案例中，p=1
因为在周围都填充了一个像素点
填充的输出变成：

( n + 2 p − f + 1 ) × ( n + 2 p − f + 1 ) (n+2p-f+1)×(n+2p-f+1)

$(n + 2 p - f + 1) \times (n + 2 p - f + 1)$

所以就变成了(6+2×1-3+1)×(6+2×1-3+1)=6×6，和输入的图像一样大
这样一来，丢失信息或者更准确来说角落或图像边缘的信息发挥的作用较小的这一缺点也被削弱了

3. Valid卷积

Valid卷积意味着不填充
一个n×n的图像，用一个

f × f f×f

$f \times f$ 的过滤器卷积
它将会给出一个

( n − f + 1 ) × ( n − f + 1 ) (n-f+1)×(n-f+1)

$(n - f + 1) \times (n - f + 1)$ 维的输出
这类似于在前面展示的例子，有一个6×6的图像
通过一个3×3的过滤器
得到一个4×4的输出

4. Same卷积

Same卷积意味填充后，输出大小和输入大小是一样的
根据这个公式

n − f + 1 n-f+1

$n - f + 1$ ，当填充

p p

$p$ 个像素点，

n n

$n$ 就变成了

n + 2 p n+2p

$n + 2 p$
最后变为

n + 2 p − f + 1 n+2p-f+1

$n + 2 p - f + 1$

一个

n × n n×n

$n \times n$ 的图像，用

p p

$p$ 个像素填充边缘
输出的大小就是：

( n + 2 p − f + 1 ) × ( n + 2 p −

f + 1 ) (n+2p-f+1)×(n+2p-f+1)

$(n + 2 p - f + 1) \times (n + 2 p - f + 1)$

如果想让输出和输入大小相等的话
使得

n + 2 p − f + 1 = n n+2p-f+1=n

$n + 2 p - f + 1 = n$
那么需要填充

p = ( f − 1 ) / 2 p=(f-1)/2

$p = (f - 1) / 2$

所以当

f f

$f$ 是一个奇数的时候，只要选择相应的填充尺寸
就能确保得到和输入相同尺寸的输出

这也是前面的例子，当过滤器是3×3时，使得输出尺寸等于输入尺寸
所需要的填充

( 3 − 1 ) / 2 (3-1)/2

$(3 - 1) / 2$ ，也就是1个像素

另一个例子，当过滤器是5×5，如果

f = 5 f=5

$f = 5$ ，代入式子
就会发现需要2层填充使得输出和输入一样大

5. 奇数的过滤器

很少看到一个偶数的过滤器在计算机视觉里使用，可能有两个原因：

如果

f f

$f$ 是一个偶数，那么只能使用一些不对称填充

当有一个奇数维过滤器，比如 3×3，就有一个中心点，会更方便指出过滤器的位置
也许这些都不是为什么

f f

$f$ 通常是奇数的充分原因
但如果看了卷积的文献，经常会看到3×3的过滤器
也可能会看到一些5×5，7×7的过滤器，也有1×1的过滤器

习惯上，推荐只使用奇数的过滤器

参考：

《神经网络和深度学习》视频课程

相关推荐：

深度学习笔记（21）边缘检测
 深度学习笔记（20）端到端学习
 深度学习笔记（19）多任务学习
 深度学习笔记（18）迁移学习
 深度学习笔记（17）误差分析（二）

谢谢！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄8年

162
原创

2500
点赞

1262
收藏

1869
粉丝

关注

私信

热门文章

分类专栏

PCL 25篇
Open3D 35篇
深度学习 100篇
opencv 100篇
工业机器视觉软件框架 7篇
毕业设计 4篇
Halcon 203篇
工业相机 4篇

最新评论

Open3D-GUI系列教程（五）鼠标事件（拾取顶点）
纳铭: 谢谢分享就是排版有点乱
PCL PCD（点云数据）文件格式
码踏云端: 这篇文章实在是太棒了！内容丰富，论述清晰，代码实例更是琳琅满目，让人阅读起来津津有味。博主的专业素养和用心程度从中可见一斑，无疑为读者提供了一笔宝贵的知识财富。
Halcon3D篇-3D预处理，滤波，点云筛选
然老公: 大佬我在滤波之后想进行提取最高层的点云例如我两个矩形一个高一个矮我想提取到最高层的点云直接后面计算矩形中心了我没有找到有效的提取最高层的函数，可否共享一下哈哈因为是多层多料且眼在手上，所以没办法用固定的Z来筛选

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。