第0节 简介
图像缩放算法是数字图像处理算法中经常遇到的问题。我们经常会将某种尺寸的图像转换为其他尺寸的图像,如放大或者缩小图像。OpenCV中的Resize() 函数非常方便而且效率非常高。下面是OPENCV提供的cvResize函数原型。
/****************************************************************************************************/ 图像大小变换 void cvResize( const CvArr* src, CvArr* dst, int interpolation=CV_INTER_LINEAR ); src 输入图像. dst 输出图像. interpolation 插值方法: CV_INTER_NN - 最近邻插值, CV_INTER_LINEAR - 双线性插值 (缺省使用) CV_INTER_AREA - 使用象素关系重采样。当图像缩小时候,该方法可以避免波纹出现。当图像放大时,类似于 CV_INTER_NN 方法.. CV_INTER_CUBIC - 立方插值. 函数 cvResize 将图像 src 改变尺寸得到与 dst 同样大小。若设定 ROI,函数将按常规支持 ROI. /****************************************************************************************************/
相信使用过Opencv的朋友都知道如何使用此函数。下面根据我自己的理解,用VC++ 来实现图像缩放算法 ,希望大家能从中理解图像缩放算法的原理。
第1节 最近邻插值
最简单的图像缩放算法就是最近邻插值。顾名思义,就是将目标图像各点的像素值设为源图像中与其最近的点。假设源图像的宽度和高度分别为w0和h0, 缩放后的目标图像的宽度和高度分别为w1和h1, 那么比例就是float fw = float(w0)/w1; float fh = float(h0)/h1; 对于目标图像中的(x,y)点坐标对应着源图像中的(x0, y0)点。其中:x0 = int(x*fw), y0 = int(y*fh)。
示例1:现在将一张670*503的BMP图像缩放到200*160,代码和效果如下。
void ResizeNear01(CImage &src, CImage &dst) { int w0 = src.GetWidth(); int h0 = src.GetHeight(); int w1 = dst.GetWidth(); int h1 = dst.GetHeight(); float fw = float(w0) / w1; float fh = float(h0) / h1; int x0, y0; for(int y=0; y<h1; y++) { y0 = int(y * fh); for(int x=0; x<w1; x++) { x0 = int(x * fw); dst.SetPixel(x, y, src.GetPixel(x0, y0)); } } }
分析:对于此程序,我们将执行此ResizeNear01函数的语句加上一个for循环,使其执行100次,看它的速度怎么样。
#include <time.h> void CResizeDemoDlg::OnBnClickedButton1() { // TODO: Add your control notification handler code here CImage src, dst; src.Load(L"d:\\1.bmp"); dst.Create(200, 160, 24); clock_t start = clock(); for(int i=0; i<100; i++) { ResizeNear01(src, dst); } float end = float(clock() - start)/CLOCKS_PER_SEC; CString str; str.Format(L"%6.2f", end); MessageBox(str); dst.Save(L"d:\\rs.jpg"); }
显示程序执行所用的时间为20.59秒,平均一次需要0.2秒,看起来速度还可以,是因为时间复杂度较低。目标图像的尺寸大小是200*160。
示例2:示例1中的算法可以改进速度的地方有两个。第一,因为最近邻插值算法求源图像中的坐标是固定的,可以把每个目标每个x和每个y对应的值通过一次循环先求出来,再利进入双重循环。第二,使用指针效率更高,如果使用CImage提供的GetPixel和SetPixel是费时间的。
//优化后的最近邻插值算法 void ResizeNear02(CImage &src, CImage &dst) { int w0 = src.GetWidth(); int h0 = src.GetHeight(); int pitch0 = src.GetPitch(); int w1 = dst.GetWidth(); int h1 = dst.GetHeight(); int pitch1 = dst.GetPitch(); float fw = float(w0) / w1; float fh = float(h0) / h1; int *arr_x = new int[w1]; int *arr_y = new int[h1]; for(int y=0; y<h1; y++) { arr_y[y] = int(y*fh); } for(int x=0; x<w1; x++) { arr_x[x] = int(x*fw); } BYTE* pSrc = (BYTE*)src.GetBits(); BYTE* pDst = (BYTE*)dst.GetBits(); BYTE* p0, *p1; for(int y=0; y<h1; y++) { p0 = pSrc + pitch0 * arr_y[y]; p1 = pDst + pitch1 * y; for(int x=0; x<w1; x++) { //dst.SetPixel(x, y, src.GetPixel(arr_x[x], arr_y[y])); memcpy(p1 + 3*x, p0 + arr_x[x]*3, 3); } } delete []arr_x; delete []arr_y; }
同样执行示例1中的测试程序,让ResizeNear02也循环一百次,在我机器上测试得到的结果是0.05秒,速度提高了400倍,这是一件多么让人兴奋的事情啊。
本人接触图像处理虽然也快一年了,但还是新手,望大家多多指正。