上采样、以及反卷积&空洞卷积区别

本文详细介绍了上采样技术,包括Resize、反卷积和反池化,并重点讨论了反卷积在CNN可视化、FCN和GAN中的应用。同时,对比了反卷积和空洞卷积(膨胀卷积)的区别,指出反卷积用于尺寸放大,而空洞卷积用于增大感受野。
摘要由CSDN通过智能技术生成

一、 上采样(upsampling)
upsampling(上采样)的三种方式:
Resize,如双线性插值直接缩放,类似于图像缩放;
反卷积(deconvolution & transposed convolution);
反池化(unpooling)。

上采样upsampling的主要目的是放大图像,几乎都是采用内插值法,即在原有图像像素的基础上,在像素点值之间采用合适的插值算法插入新的元素。

传统的网络是subsampling的,对应的输出尺寸会降低;upsampling的意义在于将小尺寸的高维度feature map恢复回去,以便做pixelwise prediction,获得每个点的分类信息。

大名鼎鼎的FCN使用反卷积来完成上采样的过程。

1.Resize
线性插值法(linear interpolation)
  这里讲解线性插值法的推导为了给双线性插值公式做铺垫。
  线性插值法是指使用连接两个已知量的直线来确定在这个两个已知量之间的一个未知量的值的方法。
  假设已知两个坐标(x0,y0)(x0,y0)和(x1,y1)(x1,y1),要得到[x0,x1][x0,x1]区间内某一位置x在直线上的值。

该直线的方程可表示为:

假设方程两边的值为α,那么这个值就是插值系数——从x0x0到xx的距离与从x0x0到x1x1的距离的比值。由于x已知,所以可以从公式中得到α的值:

这样

也就是:

2、双线性插值
  双线性插值是插值算法中的一种,是线性插值的扩展。利用原图像中目标点四周的四个真实存在的像素值来共同决定目标图中的一个像素值,其核心思想是在两个方向分别进行一次线性插值。

image.png
已知的红色数据点和待插值的绿色数据点
  假如我们想得到未知函数f在点P= (x,y) 的值,假设我们已知函数f在Q11=(x1,y1)、Q12=(x1,y2),Q21=(x2,y1)以及Q22=(x2,y2)Q11=(x1,y1)、Q12=(x1,y2),Q21=(x2,y1)以及Q22=(x2,y2) 四个点 值。
  第一步:X方向的线性插值,在Q12,Q22中插入蓝色点R2,Q11,Q21中插入蓝色点R1;

第二步 :Y方向的线性插值 ,通过第一步计算出的R1与R2在y方向上插值计算出P点。

在x与y方向上,z值成单调性特性的应用中,此种方法可以做外插运算

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值