nn.ConvTranspose2d中output_padding参数理解

比如图片尺寸6×6,步长为2,卷积核为3×3,padding=1,输出的图片尺寸应为(6+2-3)/2+1 = 3。如果输入图片是5×5,步长为2,卷积核为3×3,padding=1,那么输出为(5+2-3)/2+1=3,也是3*3。
这样的话使用反卷积还原图像尺寸时就会争议。
解决争议的办法就是使用output_padding参数,output_padding的值默认为stride-1,这样还原得到的图像尺寸就为输入的stride倍,也就是out_size=stirde×in_size。

比如这里的3×3图像进行反卷积后,默认得到的输出尺寸应为6×6。如果想得到5×5的输出,更改output_padding的值为0即可。

  • 为什么output_padding的值默认为stride-1呢?

    大多数情况下希望经过反卷积处理后的图像尺寸/输入的图像尺寸的比例与步长相等(out_size=stirde×in_size)。因此pytorch将参数padding默认设置为(kernel_size - 1)/2 ,在源代码注释中可以看到:
    在这里插入图片描述
    将padding=(kernel_size - 1)/2代入上式中,
    在这里插入图片描述

总结
由于卷积核滑动过程中,边界情况的不确定,使得在运算步长大于1的反卷积时会出现多种合法输出尺寸,pytorch的反卷积层提供了output_padding供使用者选择输出,一般情况下希望输入输出尺寸以步长成比例,因此output_padding一般取stride-1,同时padding取 (kernel_size - 1)/2 。

  • 9
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值