OpenCV学习笔记（二） cv::Mat

最新推荐文章于 2024-05-21 17:26:41 发布

weixin_30516243

最新推荐文章于 2024-05-21 17:26:41 发布

阅读量93

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/ericxing/p/3575541.html

版权

部分内容转自：OpenCV Tuturial，ggicci

在OpenCV Tuturial中可查看Mat的初始化与打印方法。

Mat本质上是由两个数据部分组成的类：

矩阵头（包含矩阵尺寸，存储方法，存储地址等信息）
一个指向存储所有像素值的矩阵（根据所选存储方法的不同矩阵可以是不同的维数）的指针

OpenCV使用引用计数机制。其思路是让每个 Mat 对象有自己的信息头，但共享同一个矩阵。这通过让矩阵指针指向同一地址而实现。而拷贝构造函数则 只拷贝信息头和矩阵指针 ，而不拷贝矩阵。

特性

reference counting：当counting为0时，会自动释放内存；
shallow copy：当令mat1=mat2时，二者指向的是同一份image data，对mat2的修改会等效作用于mat1上，如果确实要拷贝出一个副本时，需要调用copyTo函数或者clone函数。

Mat A, C;                                 // 只创建信息头部分
A = imread(argv[1], CV_LOAD_IMAGE_COLOR); // 这里为矩阵开辟内存
Mat B(A);                                 // 使用拷贝构造函数
C = A;                                    // 赋值运算符

以上代码中的所有Mat对象最终都指向同一个也是唯一一个数据矩阵。虽然它们的信息头不同，但通过任何一个对象所做的改变也会影响其它对象。实际上，不同的对象只是访问相同数据的不同途径而已。注意，这个特性要求OpenCV中的类应该返回副本copyTo(returnMat)，否则当某个类的实体发生改变时，该类的其余实体都会发生改变。

你可以创建只引用部分数据的信息头。比如想要创建一个感兴趣区域（ ROI ），你只需要创建包含边界信息的信息头：

// ROI是某个矩形
Mat D (A, Rect(10, 10, 100, 100) ); // using a rectangle
Mat E = A(Range:all(), Range(1,3)); // using row and column boundaries
// 假如ROI是某些行或者列时：
cv::Mat imageROI= image.rowRange(start,end) ;
cv::Mat imageROI= image.colRange(start,end) ;
// 单行或者单列时：
image.row(rowNum),image.col(colNum)

出于效率优化，每行的结尾可能存在padding，使得每行大小是2的整数次幂，可以通过M.isContinuous()判断是否存在padding（True:不存在padding）。当不存在padding时，Mat image的内存占用为(byte)=image.elemSize() * image.total()

属性

data：Mat对象中的一个指针，指向内存中存放矩阵数据的一块内存 (uchar* data)
dims：Mat所代表的矩阵的维度，如 3 * 4 的矩阵为 2 维， 3 * 4 * 5 的为3维
channels()：通道，矩阵中的每一个矩阵元素拥有的值的个数，比如说 3 * 4 矩阵中一共 12 个元素，如果每个元素有三个值，那么就说这个矩阵是 3 通道的，即 channels = 3。常见的是一张彩色图片有红、绿、蓝三个通道。
depth()：深度，即每一个像素的位数(bits)，在opencv的Mat.depth()中得到的是一个 0 – 6 的数字，分别代表不同的位数：enum { CV_8U=0, CV_8S=1, CV_16U=2, CV_16S=3, CV_32S=4, CV_32F=5, CV_64F=6 }; 可见 0和1都代表8位， 2和3都代表16位，4和5代表32位，6代表64位；
step：是一个数组，定义了矩阵的布局，包括padding部分，具体见下面图片分析，另外注意M.step[m-1] == M.elemSize()；
step1(n) == step[n] / elemSize1，M.step1(m-1)总是等于 channels；
elemSize() : 矩阵中每一个元素的数据大小，如果Mat中的数据的数据类型是 CV_8U 那么 elemSize = 1，CV_8UC3 那么 elemSize = 3，CV_16UC2 那么 elemSize = 4；
elemSize1()：表示的是矩阵中数据类型的大小，即 elemSize / channels 的大小
total()：像素的总数

地址计算

灰度图的每个像素都是0~255的8 bit值。彩色图有BGR三通道，其像素可视为一个三维向量，每个分量也是一个0~255的8 bit值。代码中有时存在第四维alpha，表示透明度。

最小的数据类型可能是 char 类型，这意味着一个字节或 8 位。这可能是有符号（值-127 到 + 127）或无符号（以便可以存储从 0 到 255 之间的值）。虽然这三个组件的情况下已经给 16 万可能的颜色来表示（如 RGB 的情况下），我们可通过使用浮点数（4 字节 = 32 位）或double（8 字节 = 64 位）数据类型的每个组件获得甚至更精细的控制。

注意：当目标为ROI时，地址计算失效。

addr(M_{i₀,i₁,…i_m-1})=M.data + M.step[0] * i₀ + M.step[1] * i₁ + … + M.step[m-1] * i_m-1

(其中 m = M.dims M的维度)

考虑二维情况（stored row by row）按行存储：

M.dims == 2 ;

当数据类型为 CV_8U单通道的 uchar 时：

M.channels() == 1 ;

M.elemSize() == 1
M.elemSize1() == 1 ;

M.step[0] == 4 ;
M.step[1] == 1;
M.step1(0) == 4;
M.step1(1) == 1；

当数据类型是 CV_8UC3三通道：

M.channels() == 3；
M.elemSize() == 3
M.elemSize1() == 1
M.step[0] == 12 ;
M.step[1] == 3；
M.step1(0) == 12 ;
M.step1(1) == 3；

当数据类型为 CV_16SC4，也就是 short 类型：

M.dims == 3 ;
M.rows == M.cols == –1；
M.channels() == 4 ;
M.elemSize1() == sizeof(short) == 2 ;
M.elemSize() == M.elemSize1() * M.channels() == M.step[M.dims-1] == M.step[2] == 2 * 4 == 8;
M.step[0] == 4 * 6 * M.elemSize() == 192；
M.step[1] == 6 * M.elemSize() == 48；
M.step[2] == M.elemSize() == 8；
M.step1(0) == M.step[0] / M.elemSize() == 48 / 2 == 96 （第一维度(即面的元素个数) * 通道数）；
M.step1(1) == M.step[1] / M.elemSize() == 12 / 2 == 24（第二维度(即行的元素个数/列宽) * 通道数）；
M.step1(2) == M.step[2] / M.elemSize() == M.channels() == 4（第三维度(即元素) * 通道数）；

其他

P.S.1

在OpenCV1中采用的IplImage（Intel Image Processing Library）类型应尽量不再使用。可用以下方法将IplImage转为Mat：

IplImage* iplImage = cvLoadImage("c:\\img.jpg");

cv::Mat image(iplImage,false); //false是默认参数，表示浅拷贝，即image指向同一区域，不额外占用空间。

若确实需要使用IplImage时，应注意dangling pointer的问题，可选择：

使用reference counting pointer：cv::Ptr<IplImage> iplImage = cvLoadImage("c:\\img.jpg");
显式销毁指针：cvReleaseImage(&iplImage);

P.S.2

Mat 中的channel是BGR，在Qt中显示的图像需是QImage类型（通道为RGB），可通过以下方式转换：

// change color channel ordering
cv::cvtColor(image,image,CV_BGR2RGB); 
// Qt image
QImage img= QImage((const unsigned char*)(image.data), image.cols,image.rows,QImage::Format_RGB888);
// display on label
ui->label->setPixmap(QPixmap::fromImage(img)); 
// resize the label to fit the image
ui->label->resize(ui->label->pixmap()->size());

P.S.3

Mat的几个method：

cv::Mat image=imread("image.jpg"), result;
// 第i行的地址
uchar* data = image.ptr<uchar>(0);
// 按照image的大小和类型格式化 Mat result
result.create(image.rows,image.cols,image.type());
// ROI访问某行或者某列
result.row(0).setTo(cv::Scalar(0));
result.row(result.rows-1).setTo(cv::Scalar(0));
// 在不占用内存的情况下，改变矩阵的维数
image.reshape(1, // new number of channels
              image.cols*image.rows) ; // new number of rows
// True:每行的结尾不存在padding
if (image.isContinuous()){
    /*图像的内存空间是连续的*/
    nc= nc*nl; 
    nl= 1; // it is now a 1D array
}

完

转载于:https://www.cnblogs.com/ericxing/p/3575541.html

weixin_30516243

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenCV学习笔记（二） cv::Mat

部分内容转自：OpenCV Tuturial，ggicci在OpenCV Tuturial中可查看Mat的初始化与打印方法。Mat本质上是由两个数据部分组成的类：矩阵头（包含矩阵尺寸，存储方法，存储地址等信息）一个指向存储所有像素值的矩阵（根据所选存储方法的不同矩阵可以是不同的维数）的指针OpenCV使用引用计数机制。其思路是让每个Mat对象有自己的信息头，...
复制链接

扫一扫