nn.Conv2d中padding详解【pytorch学习】

最新推荐文章于 2024-06-26 14:10:25 发布

肥宅_Sean

最新推荐文章于 2024-06-26 14:10:25 发布

阅读量2w

点赞数 12

分类专栏： Python 机器学习+深度学习+强化学习机器学习+深度学习+强化学习 Pytorch学习文章标签： pytorch Python

本文链接：https://blog.csdn.net/a19990412/article/details/83904476

版权

282 篇文章 32 订阅

订阅专栏

48 篇文章 12 订阅

订阅专栏

30 篇文章 13 订阅

订阅专栏

在网上看了很多的解释，自己又大致的理解了一下之后明白了。

首先我们得明白什么是卷积。

但是由于我们这里只想要推理padding的大小，所以只会讨论这个大小的问题。

上面的公式就给出了，经过一次卷积之后，生成的图的大小。

上面部分其实是容易理解，加上padding有两个作用

padding的含义： 在四周加格子

如果留心上面的操作的话，会发现，只有当kernal=1并且stride=1的时候，新图的大小才能等于原始大小。否则只能更小。但是对于研究深度学习的人（调模型参数的菜鸡们），这个怎么可以容忍了，没有参数可以调了！！只能是1！那还搞什么啊！
所以，加上了padding

加上padding之后，上面的公式就要发生修改了。

$(O r i g i n a l S i z e - (K e r n a l S i z e - 1) + 2 * p a d d i n g) / s t r i d e$

因为padding如果是数值的话，表示的是两边都加。也就加了两遍的padding在origin的大小上，所以，就乘以2

使得边缘的数据可以被用到。非常显然，这里的边缘数据都很少被用到的。

所以加上之后，扩充了整个图，让边缘的数据的用到次数得到提高。这样才能更好的得到整张图的特征。

$\frac{InputSize - KernalSize + 2 * Padding}{stride} + 1$

非常奇怪，公式是这样的。
其实，当OutputSize这些都是2的倍数的时候，这个是没什么考虑的。
个人认为是考虑到有奇数的情况。但具体的我也没有经过数学推导证明过，如果有的话，欢迎大佬分享。

这里就引进了一个新的参数，那就是bias.

有兴趣的朋友可以自己查一查。

关注