最近邻插值、双线性插值理论，通过仿射变换使用插值算法

最新推荐文章于 2024-09-09 20:47:35 发布

yangdeshun888

最新推荐文章于 2024-09-09 20:47:35 发布

阅读量4.4k

点赞数 3

本文链接：https://blog.csdn.net/yangdashi888/article/details/53114379

版权

插值主要使用利用到，图像放大、缩小、仿射、透射变换上的。

void cvResize( const CvArr* src, CvArr* dst, int interpolation=CV_INTER_LINEAR ); src 输入图像. dst 输出图像. interpolation 插值方法:

CV_INTER_NN - 最近邻插值,
CV_INTER_LINEAR - 双线性插值 (缺省使用)
CV_INTER_AREA - 使用象素关系重采样。当图像缩小时候，该方法可以避免波纹出现。当图像放大时，类似于 CV_INTER_NN 方法..
CV_INTER_CUBIC - 立方插值.

函数 cvResize 将图像 src 改变尺寸得到与 dst 同样大小。若设定 ROI，函数将按常规支持 ROI.

最近邻插值：效果（放大4倍）有马赛克现象

双线性插值：效果（放大4倍）比最近邻插值效果好

最近邻插值和双线性插值的基本原理

图像的缩放很好理解,就是图像的放大和缩小。传统的绘画工具中,有一种叫做“放大尺”的绘画工具，画家常用它来放大图画。当然，在计算机上，我们不再需要用放大尺去放大或缩小图像了，把这个工作交给程序来完成就可以了。下面就来讲讲计算机怎么来放大缩小图象；在本文中，我们所说的图像都是指点阵图，也就是用一个像素矩阵来描述图像的方法，对于另一种图像：用函数来描述图像的矢量图，不在本文讨论之列。
越是简单的模型越适合用来举例子，我们就举个简单的图像：3X3 的256级灰度图，也就是高为3个象素，宽也是3个象素的图像，每个象素的取值可以是 0－255，代表该像素的亮度，255代表最亮，也就是白色，0代表最暗，即黑色。假如图像的象素矩阵如下图所示（这个原始图把它叫做源图，Source）：
234   38    22
67     44    12
89     65    63

这个矩阵中，元素坐标(x,y)是这样确定的，x从左到右，从0开始，y从上到下，也是从零开始，这是图象处理中最常用的坐标系，就是这样一个坐标：

----------------------＞X
|
|
|
|
|
∨Y

如果想把这副图放大为 4X4大小的图像，那么该怎么做呢？那么第一步肯定想到的是先把4X4的矩阵先画出来再说，好了矩阵画出来了，如下所示，当然，矩阵的每个像素都是未知数，等待着我们去填充（这个将要被填充的图的叫做目标图,Destination）：
?        ?        ?       ?
?        ?        ?       ?
?        ?        ?       ?
?        ?        ?       ?

        然后要往这个空的矩阵里面填值了，要填的值从哪里来来呢？是从源图中来，好，先填写目标图最左上角的象素，坐标为（0，0），那么该坐标对应源图中的坐标可以由如下公式得出：
srcX=dstX* (srcWidth/dstWidth) , srcY = dstY * (srcHeight/dstHeight)
好了，套用公式，就可以找到对应的原图的坐标了(0*(3/4),0*(3/4))=>(0*0.75,0*0.75)=>(0,0)
,找到了源图的对应坐标,就可以把源图中坐标为(0,0)处的234象素值填进去目标图的(0,0)这个位置了。

接下来,如法炮制,寻找目标图中坐标为(1,0)的象素对应源图中的坐标,套用公式:
(1*0.75,0*0.75)=>(0.75,0)
结果发现,得到的坐标里面竟然有小数,这可怎么办?计算机里的图像可是数字图像,象素就是最小单位了,象素的坐标都是整数,从来没有小数坐标。这时候采用的一种策略就是采用四舍五入的方法（也可以采用直接舍掉小数位的方法），把非整数坐标转换成整数，好，那么按照四舍五入的方法就得到坐标（1，0），完整的运算过程就是这样的：
(1*0.75,0*0.75)=>(0.75,0)=>(1,0)
那么就可以再填一个象素到目标矩阵中了，同样是把源图中坐标为(1,0)处的像素值38填入目标图中的坐标。

依次填完每个象素，一幅放大后的图像就诞生了，像素矩阵如下所示：
234    38     22     22
67      44     12     12
89      65     63     63
89      65     63     63

这种放大图像的方法叫做最临近插值算法，这是一种最基本、最简单的图像缩放算法，效果也是最不好的，放大后的图像有很严重的马赛克，缩小后的图像有很严重的失真；效果不好的根源就是其简单的最临近插值方法引入了严重的图像失真，比如，当由目标图的坐标反推得到的源图的的坐标是一个浮点数的时候，采用了四舍五入的方法，直接采用了和这个浮点数最接近的象素的值，这种方法是很不科学的，当推得坐标值为 0.75的时候，不应该就简单的取为1，既然是0.75，比1要小0.25 ，比0要大0.75 ,那么目标象素值其实应该根据这个源图中虚拟的点四周的四个真实的点来按照一定的规律计算出来的，这样才能达到更好的缩放效果。双线型内插值算法就是一种比较好的图像缩放算法，它充分的利用了源图中虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值，因此缩放效果比简单的最邻近插值要好很多。

双线性内插值算法描述如下:
　　对于一个目的像素，设置坐标通过反向变换得到的浮点坐标为(i+u,j+v) (其中i、j均为浮点坐标的整数部分，u、v为浮点坐标的小数部分，是取值[0,1)区间的浮点数)，则这个像素得值 f(i+u,j+v) 可由原图像中坐标为 (i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)所对应的周围四个像素的值决定，即：

　　f(i+u,j+v) = (1-u)(1-v)f(i,j) + (1-u)vf(i,j+1) + u(1-v)f(i+1,j) + uvf(i+1,j+1) 公式1

其中f(i,j)表示源图像(i,j)处的的像素值，以此类推。

比如，象刚才的例子，现在假如目标图的象素坐标为（1，1），那么反推得到的对应于源图的坐标是（0.75 , 0.75）, 这其实只是一个概念上的虚拟象素,实际在源图中并不存在这样一个象素,那么目标图的象素（1，1）的取值不能够由这个虚拟象素来决定，而只能由源图的这四个象素共同决定：（0，0）（0，1）（1，0）（1，1），而由于（0.75,0.75）离（1，1）要更近一些，那么（1,1）所起的决定作用更大一些，这从公式1中的系数uv=0.75×0.75就可以体现出来，而（0.75,0.75）离（0，0）最远，所以（0，0）所起的决定作用就要小一些，公式中系数为(1-u)(1-v)=0.25×0.25也体现出了这一特点。

其中scale为缩放因子(x、y方向保持一致)，angle为旋转角度(弧长)，centerx，centery为旋转中心。

以lena.jpg图像旋转45度为例：

采用最近邻插值算法的实现代码为：

cv::Mat matSrc = cv::imread("lena.jpg", 2 | 4);  
  
if (matSrc.empty()) return;  
  
const double degree = 45;  
double angle = degree * CV_PI / 180.;  
double alpha = cos(angle);  
double beta = sin(angle);  
int iWidth = matSrc.cols;  
int iHeight = matSrc.rows;  
int iNewWidth = cvRound(iWidth * fabs(alpha) + iHeight * fabs(beta));  
int iNewHeight = cvRound(iHeight * fabs(alpha) + iWidth * fabs(beta));  
  
double m[6];  
m[0] = alpha;  
m[1] = beta;  
m[2] = (1 - alpha) * iWidth / 2. - beta * iHeight / 2.;  
m[3] = -m[1];  
m[4] = m[0];  
m[5] = beta * iWidth / 2. + (1 - alpha) * iHeight / 2.;  
  
cv::Mat M = cv::Mat(2, 3, CV_64F, m);  
cv::Mat matDst1 = cv::Mat(cv::Size(iNewWidth, iNewHeight), matSrc.type(), cv::Scalar::all(0));  
  
double D = m[0]*m[4] - m[1]*m[3];  
D = D != 0 ? 1./D : 0;  
double A11 = m[4]*D, A22 = m[0]*D;  
m[0] = A11; m[1] *= -D;  
m[3] *= -D; m[4] = A22;  
double b1 = -m[0]*m[2] - m[1]*m[5];  
double b2 = -m[3]*m[2] - m[4]*m[5];  
m[2] = b1; m[5] = b2;  
  
int round_delta = 512;//nearest  
for (int y=0; y<iNewHeight; ++y)  
{  
    for (int x=0; x<iNewWidth; ++x)  
    {  
        //int tmpx = cvFloor(m[0] * x + m[1] * y + m[2]);  
        //int tmpy = cvFloor(m[3] * x + m[4] * y + m[5]);  
        int adelta = cv::saturate_cast<int>(m[0] * x * 1024);  
        int bdelta = cv::saturate_cast<int>(m[3] * x * 1024);  
        int X0 = cv::saturate_cast<int>((m[1] * y + m[2]) * 1024) + round_delta;  
        int Y0 = cv::saturate_cast<int>((m[4] * y + m[5]) * 1024) + round_delta;  
        int X = (X0 + adelta) >> 10;  
        int Y = (Y0 + bdelta) >> 10;  
  
        if ((unsigned)X < iWidth && (unsigned)Y < iHeight)  
        {  
            matDst1.at<cv::Vec3b>(y, x) = matSrc.at<cv::Vec3b>(Y, X);  
        }  
    }  
}  
cv::imwrite("rotate_nearest_1.jpg", matDst1);  
  
M = cv::getRotationMatrix2D(cv::Point2f(iWidth / 2., iHeight / 2.), degree, 1);  
  
cv::Mat matDst2;  
cv::warpAffine(matSrc, matDst2, M, cv::Size(iNewWidth, iNewHeight), 0, 0, 0);  
cv::imwrite("rotate_nearest_2.jpg", matDst2);

采用双线性插值算法的实现代码为：

cv::Mat matSrc = cv::imread("lena.jpg", 2 | 4);  
  
if (matSrc.empty()) return;  
  
const double degree = 45;  
double angle = degree * CV_PI / 180.;  
double alpha = cos(angle);  
double beta = sin(angle);  
int iWidth = matSrc.cols;  
int iHeight = matSrc.rows;  
int iNewWidth = cvRound(iWidth * fabs(alpha) + iHeight * fabs(beta));  
int iNewHeight = cvRound(iHeight * fabs(alpha) + iWidth * fabs(beta));  
  
double m[6];  
m[0] = alpha;  
m[1] = beta;  
m[2] = (1 - alpha) * iWidth / 2. - beta * iHeight / 2.;  
m[3] = -m[1];  
m[4] = m[0];  
m[5] = beta * iWidth / 2. + (1 - alpha) * iHeight / 2.;  
  
cv::Mat M = cv::Mat(2, 3, CV_64F, m);  
cv::Mat matDst1 = cv::Mat(cv::Size(iNewWidth, iNewHeight), matSrc.type(), cv::Scalar::all(0));  
  
double D = m[0]*m[4] - m[1]*m[3];  
D = D != 0 ? 1./D : 0;  
double A11 = m[4]*D, A22 = m[0]*D;  
m[0] = A11; m[1] *= -D;  
m[3] *= -D; m[4] = A22;  
double b1 = -m[0]*m[2] - m[1]*m[5];  
double b2 = -m[3]*m[2] - m[4]*m[5];  
m[2] = b1; m[5] = b2;  
  
for (int y=0; y<iNewHeight; ++y)  
{  
    for (int x=0; x<iNewWidth; ++x)  
    {  
        //int tmpx = cvFloor(m[0] * x + m[1] * y + m[2]);  
        //int tmpy = cvFloor(m[3] * x + m[4] * y + m[5]);  
        float fx = m[0] * x + m[1] * y + m[2];  
        float fy = m[3] * x + m[4] * y + m[5];  
  
        int sy  = cvFloor(fy);  
        fy -= sy;  
        //sy = std::min(sy, iHeight-2);  
        //sy = std::max(0, sy);  
        if (sy < 0 || sy >= iHeight) continue;  
  
        short cbufy[2];  
        cbufy[0] = cv::saturate_cast<short>((1.f - fy) * 2048);  
        cbufy[1] = 2048 - cbufy[0];  
  
        int sx = cvFloor(fx);  
        fx -= sx;  
        //if (sx < 0) {  
        //  fx = 0, sx = 0;  
        //}  
        //if (sx >= iWidth - 1) {  
        //  fx = 0, sx = iWidth - 2;  
        //}  
        if (sx < 0 || sx >= iWidth) continue;  
  
        short cbufx[2];  
        cbufx[0] = cv::saturate_cast<short>((1.f - fx) * 2048);  
        cbufx[1] = 2048 - cbufx[0];  
  
        for (int k=0; k<matSrc.channels(); ++k)  
        {  
            if (sy == iHeight - 1 || sx == iWidth - 1) {  
                continue;  
            } else {  
                matDst1.at<cv::Vec3b>(y, x)[k] = (matSrc.at<cv::Vec3b>(sy, sx)[k] * cbufx[0] * cbufy[0] +  
                    matSrc.at<cv::Vec3b>(sy+1, sx)[k] * cbufx[0] * cbufy[1] +  
                    matSrc.at<cv::Vec3b>(sy, sx+1)[k] * cbufx[1] * cbufy[0] +  
                    matSrc.at<cv::Vec3b>(sy+1, sx+1)[k] * cbufx[1] * cbufy[1]) >> 22;  
            }  
        }  
    }  
}  
cv::imwrite("rotate_bilinear_1.jpg", matDst1);  
  
M = cv::getRotationMatrix2D(cv::Point2f(iWidth / 2., iHeight / 2.), degree, 1);  
  
cv::Mat matDst2;  
cv::warpAffine(matSrc, matDst2, M, cv::Size(iNewWidth, iNewHeight), 1, 0, 0);  
cv::imwrite("rotate_bilinear_2.jpg", matDst2);