Tensorflow卷积中Padding的两种方式

最新推荐文章于 2024-08-16 09:04:50 发布

蕉叉熵

最新推荐文章于 2024-08-16 09:04:50 发布

阅读量9.4k

点赞数 3

分类专栏：机器学习文章标签：卷积 padding

本文链接：https://blog.csdn.net/songbinxu/article/details/85328522

版权

机器学习专栏收录该内容

54 篇文章 30 订阅

订阅专栏

Tensorflow卷积中Padding的两种方式

两种Padding

VALID：若不够滑动，则将右下的剩余部分全部舍弃，从原矩阵左上角开始卷积。

$H'=\left \lceil \frac{H-k+1}{d} \right \rceil$

SAME：如果 $H / d$ 除不尽，会均匀地在左上、右下补0，令总长 $L$ 满足 $L - k + 1 = d H$ ，若补不够，则往右下补。

$H'=\left \lceil \frac{H}{d} \right \rceil$

$H$ 表示卷积前尺寸， $H^{'}$ 表示卷积后尺寸， $k$ 为卷积核尺寸， $d$ 为步长， $\left \lceil x \right \rceil$ 表示向上取整。

在 Tensorflow 的 nn_ops.py 中有关于卷积运算输出尺寸的定义。

If padding == "SAME":
  output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides[i])
If padding == "VALID":
  output_spatial_shape[i] =
    ceil((input_spatial_shape[i] -
          (spatial_filter_shape[i]-1) * dilation_rate[i])
         / strides[i]).

举例

例一

考虑大小为 $(N, 3, 3, C)$ 的输入，忽略 $b a t c h s i z e$ 和 $c h a n n e l$ ，即考虑 $(3, 3)$ 大小的矩阵。现在用 $(3, 3)$ 大小的卷积核（方便起见，卷积核参数均为1）做步长 $(1, 1)$ 的卷积。padding=VALID 时，直接从矩阵左上角开始滑动，刚好 $(3, 3)$ 覆盖到了矩阵右下角，卷积结束，padding=SAME 时，先在周围补零，需要补零至长度 $L$ ，使 $L - k + 1 = d H$ ，故此处应补至5，即左上和右下各补一圈即可。最后再从补零后的矩阵的左上角开始滑动，直到右下角。

在这里插入图片描述

例二

考虑大小为 $(N, 3, 3, C)$ 的输入，忽略 $b a t c h s i z e$ 和 $c h a n n e l$ ，即考虑 $(3, 3)$ 大小的矩阵。现在用 $(2, 2)$ 大小的卷积核（方便起见，卷积核参数均为1）做步长 $(2, 2)$ 的卷积。padding=VALID 时，直接从矩阵左上角开始滑动， $(2, 2)$ 没有到达矩阵右下角，卷积就结束了，剩余的将直接舍弃掉。padding=SAME 时，先在周围补零，这里需要补长至4，优先补右下角，故在右下补一圈0。最后再从补零后的矩阵的左上角开始滑动，直到右下角。