人工智能/机器学习基础知识——上采样（UpSampling）

最新推荐文章于 2024-08-02 19:30:00 发布

ZreviaX

最新推荐文章于 2024-08-02 19:30:00 发布

阅读量597

点赞数 8

分类专栏：人工智能/机器学习基础知识文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/WindGrin_/article/details/137617864

版权

31 篇文章 0 订阅

订阅专栏

本文介绍了上采样技术，特别是双线性插值在FCN中的应用，通过线性插值估算像素值。同时讨论了反卷积（转置卷积和微步卷积）的概念，它们的区别以及如何通过反池化和反采样恢复图像尺寸。

摘要由CSDN通过智能技术生成

UpSampling

上采样

双线性插值，FCN中上采样所采用的方法

在这里插入图片描述

假设当前已知函数 $f$ 在 $Q_{11}$ 、 $Q_{12}$ 、 $Q_{21}$ 、 $Q_{22}$ 四个点处的值，我们想得到未知函数 $f$ 在点 $P = (x, y)$ 处的值
x方向线性插值：
$f(R_1) \approx \frac{x_2 - x}{x_2 - x_1}f(Q_{11}) + \frac{x - x_1}{x_2 - x_1}f(Q_{21})$
$f(R_2) \approx \frac{x_2 - x}{x_2 - x_1}f(Q_{12}) + \frac{x - x_1}{x_2 - x_1}f(Q_{22})$
y方向线性插值：
$\approx \frac{y_2 - y}{y_2 - y_1}f(R_1) + \frac{y - y_1}{y_2 - y_1}f(R_2)$
双线性插值其实就是分别在x、y方向做一次线性插值，本质上就是利用周围四个点的像素值来近似中间某点的像素值
实际运用中，如缩放图像中的双线性插值，是根据原图像与目标图像尺寸的比值以及目标图像的坐标来计算目标图像的某一像素对应于原图像中的哪一个像素点：
$\frac{srcWidth}{dstWidth}$
$\frac{srcHeight}{dstHeight}$
$(src X, src Y)$ 算出来一般都是浮点数，这时就取离该坐标最近的四个整数像素点并应用双线性插值。（实际应用中还需几何中心对齐以及加速优化，详见链接）

反卷积（转置卷积 + 微步卷积）

在这里插入图片描述

在这里插入图片描述

反卷积无法还原出卷积之前的图片，只能还原出卷积之前图片的尺寸。其与普通卷积主要区别在于：反卷积输出图片的尺寸会大于输入图片的尺寸，通过增加Padding来实现这一操作（图中蓝色方块代表输入图片的Pixel，白色代表Padding）。
转置卷积和微步卷积在Padding方式上不同
应用：GAN生成对抗图像…
DeConv Output Shape：

$N = (W - 1) S - 2 P + F$
其中， $N$ 为输出， $W$ 为输入， $S$ 为步长， $P$ 为填充， $F$ 为卷积核。反卷积的步长是通过间隔插值实现的