IplImage的数据结构

最新推荐文章于 2022-10-10 10:31:47 发布

jiangdf

最新推荐文章于 2022-10-10 10:31:47 发布

阅读量1.2k

点赞数

分类专栏： OpenCV 文章标签： struct 数据结构 image processing codec library

OpenCV 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在讨论过CvMat类型后，我们可以开始讨论它的继承类IplImage类型了。IplImage类型除了继承了CvMat类的成员变量外，还定义了一些跟图像有关的成员变量。这个结构体最初是定义在Intel's Image Processing Library(IPL)中的。以下是该数据结构的定义：
typedef struct _IplImage {
int                  nSize;
int                  ID;
int                  nChannels;
int                  alphaChannel;
int                  depth;
char                 colorModel[4];
char                 channelSeq[4];
int                  dataOrder;
int                  origin;
int                  align;
int                  width;
int                  height;
struct _IplROI*      roi;
struct _IplImage*    maskROI;
void*                imageId;
struct _IplTileInfo* tileInfo;
int                  imageSize;
char*                imageData;
int                  widthStep;
int                  BorderMode[4];
int                  BorderConst[4];
char*                imageDataOrigin;
} IplImage;

depth和nChannels是非常重要的属性。depth代表颜色深度，使用的是以下定义的宏,nChannels是通道数，为1,2,3或4。
depth的宏定义：
IPL_DEPTH_8U,无符号8bit整数(8u)
IPL_DEPTH_8S,有符号8bit整数(8s)
IPL_DEPTH_16S,有符号16bit整数(16s)
IPL_DEPTH_32S,有符号32bit整数(32s)
IPL_DEPTH_32F,32bit浮点数，单精度(32f)
IPL_DEPTH_64F,64bit浮点数，双精度(64f)

另外两个重要的成员变量是origin和dataOrder.
origin变量可以有两个取值：IPL_ORIGIN_TL或者IPL_ORIGIN_BL,分别代表图像坐标系原点在左上角或是左下角。相应的，在计算机视觉领域，一个重要的错误来源就是原点位置的定义不统一。例如，图像的来源不同，操作系统不同，视频解码codec不同，存储方式不同等等，都可以造成原点位置的变化。例如，你可能认为你正在从图像上面的脸部附近取样，但实际上你却在图像下方的裙子附近取样。最初时，就应该检查一下你的系统中图像的原点位置，这可以通过在图像上方画个形状等方式实现。
dataOrder的取值可以是IPL_DATA_ORDER_PIXEL或者IPL_DATA_ORDER_PLANE,这个成员变量定义了多通道图像数据存储时颜色数据的排列方式，如果是IPL_DATA_ORDER_PIXEL,通道颜色数据排列将会是BGRBGR...的交错排列，如果是IPL_DATA_ORDER_PLANE，则每个通道的颜色值在一起，有几个通道，就有几个“颜色平面”。大多数情况下，通道颜色数据的排列是交错的。
widthStep与CvMat中的step类似，是以字节数计算的图像的宽度。成员变量imageData则保存了指向图像数据区首地址的指针。
最后还有一个重要参数roi(region of interest 感兴趣的区域),这个参数是IplROI结构体类型的变量。IplROI结构体包含了xOffset,yOffset,height,width,coi成员变量，其中xOffset,yOffset是x,y坐标，coi代表channel of interest(感兴趣的通道)。有时候，OpenCV图像函数不是作用于整个图像，而是作用于图像的某一个部分。这是，我们就可以使用roi成员变量了。如果IplImage变量中设置了roi，则OpenCV函数就会使用该roi变量。如果coi被设置成非零值，则对该图像的操作就只作用于被coi指定的通道上了。不幸的是，许多OpenCV函数忽略了coi的值。

访问图像中的数据

就象访问矩阵中元素一样，我们希望用最直接的办法访问图像中的数据，例如，如果我们有一个三通道HSV图像（HSV色彩属性模式是根据色彩的三个基本属性：色相H、饱和度S和明度V来确定颜色的一种方法）,我们要将每个点的饱和度和明度设置成255，则我们可以使用指针来遍历图像，请对比一下，与矩阵的遍历有何不同：
void saturate_sv( IplImage* img ) {

for( int y=0; yheight; y++ ) {
    uchar* ptr = (uchar*) (
      img->imageData + y * img->widthStep
    );
    for( int x=0; xwidth; x++ ) {
      ptr[3*x+1] = 255;
      ptr[3*x+2] = 255;
    }
}
}

注意一下，3*x+1,3*x+2的方法，因为每一个点都有三个通道，所以这样设置。另外imageData成员的类型是uchar*，即字节指针类型，所以与CvMat的data指针类型(union)不同，而不需要象CvMat那样麻烦（还记得step/4,step/8的那种情形吗）。

对roi和widthStep的补充

roi和widthStep在实际工作中有很重要的作用，在很多情况下，使用它们会提高计算机视觉代码的执行速度。这是因为它们允许对图像的某一小部分进行操作，而不是对整个图像进行运算。在OpenCV中，所有的对图像操作的函数都支持roi,如果你想打开roi,可以使用函数cvSetImageROI(),并给函数传递一个矩形子窗口。而cvResetImageROI()是用于关闭roi的。
void cvSetImageROI(IplImage* image,CvRect rect);
void cvResetImageROI(IplImage* image);
注意，在程序中，一旦使用了roi做完相应的运算，就一定要用cvResetImageROI()来关闭roi,否则，其他操作执行时还会使用roi的定义。

#pragma comment( lib, "cxcore.lib" )
#pragma comment( lib, "cv.lib" )
#pragma comment( lib, "highgui.lib" )
#include
#include
#include
int main(int argc, char** argv)
{

    IplImage* src;
    cvNamedWindow("Example3_12_pre", CV_WINDOW_AUTOSIZE);
    cvNamedWindow("Example3_12_post", CV_WINDOW_AUTOSIZE);
   src = cvLoadImage("dog.jpg");
   int x = 150;
   int y = 300;
   int width = 200;
   int height = 200;
   int add = 150;
   cvShowImage( "Example3_12_pre", src);
   cvSetImageROI(src, cvRect(x,y,width,height));
   cvAddS(src, cvScalar(add),src);//对roi区域的每通道颜色都加上一个值
   cvResetImageROI(src);
   cvShowImage( "Example3_12_post",src);
    cvWaitKey();
   cvReleaseImage( &src );
cvDestroyWindow("Example3_12_pre");
cvDestroyWindow("Example3_12_post");
    return 0;
}
操作结果见下图：

在上面的程序中，如果你在使用完roi后，没有使用 cvResetImageROI来关闭，效果是这样的：

我们可以通过聪明地使用widthStep达到使用roi的同样的效果，这就需要创建一个子窗口，并让子窗口的图像数据指针指向主窗口中相应位置，而所做的操作是针对子窗口而做的。创建子窗口的其他方面不用多说，但是要注意，子窗口的颜色深度，通道数，widthStep都与主窗口相同，可以看下面的画图示意。

#pragma comment( lib, "cxcore.lib" )
#pragma comment( lib, "cv.lib" )
#pragma comment( lib, "highgui.lib" )
#include
#include
#include
int main(int argc, char** argv)
{

    IplImage *src,*sub_img;
    cvNamedWindow("Example3_13_pre", CV_WINDOW_AUTOSIZE);
    cvNamedWindow("Example3_13_post", CV_WINDOW_AUTOSIZE);
   src = cvLoadImage("dog.jpg");
   int x = 150;
   int y = 300;
   int width = 200;
   int height = 200;
   int add = 150;
   //子窗口的初始化
   sub_img = cvCreateImageHeader(cvSize(width, height),src->depth,src->nChannels);
    sub_img->origin = src->origin;
   //子窗口的widthStep和主窗口的widthStep相等
    sub_img->widthStep = src->widthStep;
   //注意这个公式,子窗口的图像数据指针首地址指向了主窗口中由子窗口左上角坐标x,y指定的相应位置
    sub_img->imageData = src->imageData + y * src->widthStep + x * src->nChannels;
   cvShowImage( "Example3_13_pre", src);
   cvAddS(sub_img, cvScalar(add),sub_img);
   cvShowImage( "Example3_13_post",src);
    cvWaitKey();
    cvReleaseImage( &src );
   //释放子窗口的头部资源
   cvReleaseImageHeader(&sub_img);
    cvDestroyWindow("Example3_13_pre");
    cvDestroyWindow("Example3_13_post");
    return 0;
}

那么，既然我们有了很方便的roi机制，但为什么要费这么大劲用创建子窗口的办法呢？这是因为,roi机制一次只能作用于图像的一个子区域，如果要同时处理图像的多个子区域，还是用创建子窗口的办法最好，否则你就要频繁连续地对子区域进行设置roi和取消roi的操作了。

jiangdf

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
IplImage的数据结构

在讨论过CvMat类型后，我们可以开始讨论它的继承类IplImage类型了。IplImage类型除了继承了CvMat类的成员变量外，还定义了一些跟图像有关的成员变量。这个结构体最初是定义在Intels Image Processing Library(IPL)中的。以下是该数据结构的定义：typedef struct _IplImage { int nSize
复制链接

扫一扫