深度学习笔记(4)：1.4-1.5：CNN中常用两大基本操作：padding、strided convolutions

最新推荐文章于 2024-08-16 09:04:50 发布

起个名字好难.JPG

最新推荐文章于 2024-08-16 09:04:50 发布

阅读量4.5k

点赞数 4

分类专栏：深度学习文章标签： padding strided convolutions CNN

本文链接：https://blog.csdn.net/kkkkkiko/article/details/82759941

版权

本文介绍了深度学习中卷积神经网络（CNN）的两个关键概念：padding和strided convolutions。padding通过在图像边缘添加0来防止尺寸减小并充分利用边缘信息。strided convolutions则通过调整卷积步长（stride）控制输出尺寸，并可能导致边缘信息损失。文章详细解释了这两个操作的原理和影响，并提供了相应的计算公式。

摘要由CSDN通过智能技术生成

1.4 padding

在深度学习中，需要学会的一个基本卷积操作就是padding，padding是什么意思呢？

之前未使用padding时，假设我们的图片是6*6的，在使用3*3的filter之后，图片变为4*4的，发现了什么？图片使用卷积操作之后变小了，这还只是使用一次，如果我们在深层网络中需要使用多次呢？可想而知，图片就会变得越来越小，甚至会缩小到1*1，我们当然不希望在识别边缘或其他特征时图片变得越来越小。

除此之外，这样直接使用卷积运算还有一个问题，那就是图片边缘角落的像素信息使用次数较少，这容易使我们损失掉很多处在角落位置的像素带来的信息，怎么说呢？如上图所示，我们本来是6*6的矩阵，左上角即(1,1)位置的格子，那个绿色的格子，在使用3*3的filter进行卷积运算时，我们仅使用一次，这样我们就容易损失掉这一部分包含的信息。

为了解决卷积运算带来的这两种缺点，padding思想被提出。什么是padding呢？padding就是在原图像周围再加上p圈像素，p在这里是参数，像素值我们一般取0。这样一来既不怕图像通过卷积运算变得越来越小，也不怕图像原本边缘处的信息利用不到了。

原来未加像素前，6*6的图片通过3*3的filter我们可以得到4*4的图片，这是有公式的，假设原图像是n*n，filter是f*f࿰