1.缘由
在图像语义分割任务中,需要将最终的feature map放大到原图像大小,以实现对每个pixel的分类,进而完成语义分割。下面记录下常用的图像缩放算法——双线性差值。
2.坐标映射
本文讨论的是点阵图像,以3x3像素为例,灰度级为256,将其放大至4x4。坐标系如下图所示:
假设3x3的像素矩阵称为源图,以source image表示,4x4的像素矩阵称为目标图像,以destination image表示。原图为
200 50 15
120 220 12
50 160 35
目标图像为:
? ? ? ?
? ? ? ?
? ? ? ?
? ? ? ?
目标图像中的每个像素值是多少,该如何求解,答案来自原图。原图与目标图之间的映射关系如下:
srcX=dstX*(srcWidth/dstWidth)
srcY=dstY*(srcHeight/dstHeight)
其中(dstX,dstY)为目标图像中的像素坐标,(srcX,srcY)为目标像素映射到原图中的坐标。
因此,根据以上公式可得每个目标像素对应于原图像的像素坐标&#