Tensorflow中卷积的padding操作，还有Kernel-size，stride

最新推荐文章于 2024-01-08 15:58:20 发布

happyGirl122

最新推荐文章于 2024-01-08 15:58:20 发布

阅读量3.9k

点赞数

分类专栏：深度学习

深度学习专栏收录该内容

164 篇文章 11 订阅

订阅专栏

链接：https://www.jianshu.com/p/05c4f1621c7e

之前一直对tensorflow的padding一知半解，直到查阅了tensorflow/core/kernels/ops_util.cc中的Get2dOutputSizeVerbose函数，才恍然大悟，下面是具体的介绍

实际上tensorflow官方API里有介绍！！不科学上网貌似打不开

根据tensorflow中的conv2d函数，我们先定义几个基本符号

1、输入矩阵 W×W，这里只考虑输入宽高相等的情况，如果不相等，推导方法一样，不多解释。

2、filter矩阵 F×F，卷积核

3、stride值 S，步长

4、输出宽高为 new_height、new_width

当然还有其他的一些具体的参数，这里就不再说明了。

我们知道，padding的方式在tensorflow里分两种，一种是VALID，一种是SAME，下面分别介绍这两种方式的实际操作方法。

1、如果padding = ‘VALID’

new_height = new_width = (W – F + 1) / S （结果向上取整）

也就是说，conv2d的VALID方式不会在原有输入的基础上添加新的像素（假定我们的输入是图片数据，因为只有图片才有像素），输出矩阵的大小直接按照公式计算即可。

2、如果padding = ‘SAME’

new_height = new_width = W / S （结果向上取整）

在高度上需要pad的像素数为

pad_needed_height = (new_height – 1) × S + F - W

根据上式，输入矩阵上方添加的像素数为

pad_top = pad_needed_height / 2 （结果取整）

下方添加的像素数为

pad_down = pad_needed_height - pad_top

以此类推，在宽度上需要pad的像素数和左右分别添加的像素数为

pad_needed_width = (new_width – 1) × S + F - W

pad_left = pad_needed_width / 2 （结果取整）

pad_right = pad_needed_width – pad_left

至此，关于tensorflow的卷积padding操作介绍完毕，下面是关于此操作的源码（Get2dOutputSizeVerbose函数的部分节选），我也不会用MarkDown，索性直接截图了，以供参考

下面这块源链接 https://blog.csdn.net/tiandd12/article/details/80271050

先看一下 tensorflow中自带的卷积操作是什么样子的呢？

https://tensorflow.google.cn/api_docs/python/tf/nn/conv2d

 
   [python]  
   view plaincopy
tf.nn.conv2d(  
    input,  
    filter,  
    strides,  
    padding,  
    use_cudnn_on_gpu=True,  
    data_format='NHWC',  
    dilations=[1, 1, 1, 1],  
    name=None  
)  

其中data_format这个参数我们很少了解，其实它是固定你input的格式，NHWC对应着你的输入数据的维度时[batch_size,Heigth,Width,Channel]，NCHW对应[batch_size,Channel,Heigth,Width]。

其实strides里面的参数和这个data_format是一一对应的，什么意思呢？就是说，如果我们采用NHWC的方式和strides=[a,b,c,d]的情况下，计算卷积核移动过程是怎么样的呢？它会在batch的维度上按照 step=a的大小进行移动计算，同理，分别在HWC的维度上移动的step为b c d。因为我们需要对每一个batch和channel都需要进行计算，所以这里 a,d 的值为1。b c的值可以根据实际情况进行改变，他们的值直接关系到输出的feature map 的维度。

下面这块源链接：https://blog.csdn.net/abcd302/article/details/52884574

记录下公式，总忘记：

像素宽度W，

Padding size：P，

Kernel size：K，

Stride ： S，

公式为

W n + 1 = (W n + P * 2 - K) / S + 1

happyGirl122

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Tensorflow中卷积的padding操作，还有Kernel-size，stride

链接：https://www.jianshu.com/p/05c4f1621c7e之前一直对tensorflow的padding一知半解，直到查阅了tensorflow/core/kernels/ops_util.cc中的Get2dOutputSizeVerbose函数，才恍然大悟，下面是具体的介绍实际上tensorflow官方API里有介绍！！不科学上网貌似打不开根据tensorflow中的co...
复制链接

扫一扫