在读到FPN(Feature Pyramid Network)这篇2017年的CVPR的文章时,论文是采用特征金字塔做目标检测的。
在空间金字塔中,低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。因此,本文作者采用将顶层特征通过上采样和低层特征做融合,而且每层是独立预测。在学习的过程中遇到了上采样这个难点,遂发文学习一下。
1、概述
缩小图像(或称为下采样(subsampling)或降采样(downsampling))的主要目的有两个:
- 使得图像符合显示区域的大小
- 生成对应图像的缩略图。
放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是:
- 放大原图像,从而可以显示在更高分辨率的显示设备上。
对图像的缩放操作并不能带来更多关于该图像的信息,因此图像的质量将不可避免地受到影响。上采样和下采样不是可逆过程,这是因为下采样损失了图片信息。
上采样的方法
- 插值法。插值方法有很多,比如均值,中值,最近邻。通过这种方法,在周围像素色彩的基础上用数学公式计算丢失像素的色彩。
- 反卷积。反卷积,是卷积的逆过程,即通过转置卷积核的方法来实现卷积的逆过程,又称作转置卷积 (transposed convolution)。
- 反池化。在池化过程,比如max-pooling时ÿ