OpenCV Introduction(译)

最新推荐文章于 2021-01-17 16:36:25 发布

惜缘865

最新推荐文章于 2021-01-17 16:36:25 发布

阅读量268

点赞数

分类专栏： OpenCV 文章标签： OpenCV 2.4.13

OpenCV 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

原文链接：https://blog.csdn.net/u011608180/article/details/84842086

介绍¶

OpenCV（开源计算机视觉库：http：//opencv.org）是一个开源的BSD许可库，包含数百种计算机视觉算法。该文档描述了所谓的OpenCV 2.x API，它本质上是一个C ++ API，与基于C的OpenCV 1.x API相反。后者在opencv1x.pdf中描述。

OpenCV具有模块化结构，这意味着该包包含多个共享库或静态库。可以使用以下模块：

core - 一个紧凑的模块，定义基本的数据结构，包括密集的多维数组Mat和所有其他模块使用的基本功能。
imgproc - 图像处理模块，包括线性和非线性图像滤波，几何图像变换（调整大小，仿射和透视扭曲，基于通用表的重新映射），颜色空间转换，直方图等。
video - 视频分析模块，包括运动估计，背景减法和对象跟踪算法。
calib3d - 基本的多视图几何算法，单一和立体摄像机校准，对象姿态估计，立体对应算法和3D重建元素。
features2d - 出色的特征检测器，描述符和描述符匹配器。
objdetect - 检测预定义类的对象和实例（例如，面部，眼睛，马克杯，人，汽车等）。
highgui - 易于使用的视频捕获，图像和视频编解码器界面，以及简单的UI功能。
gpu - 来自不同OpenCV模块的GPU加速算法。
一些其他帮助器模块，例如FLANN和Google测试包装器，Python绑定等

API概念

cv命名空间

所有OpenCV类和函数都放在cv命名空间中。因此，要从代码中访问此功能，请使用 cv:: 符或using namespace cv ;指示：

#include "opencv2/core/core.hpp"
...
cv::Mat H = cv::findHomography(points1, points2, CV_RANSAC, 5);
...

或者：

#include "opencv2/core/core.hpp"
using namespace cv;
...
Mat H = findHomography(points1, points2, CV_RANSAC, 5 );
...

某些当前或未来的OpenCV外部名称可能与STL或其他库冲突。在这种情况下，使用显式名称空间说明符来解决名称冲突：

Mat a(100, 100, CV_32F);
randu(a, Scalar::all(1), Scalar::all(std::rand()));
cv::log(a, a);
a /= std::log(2.);

自动内存管理

OpenCV自动处理所有内存

首先，函数和方法使用的std :: vector，Mat和其他数据结构都有析构函数，可以在需要时释放底层内存缓冲区。这意味着析构函数并不总是释放缓冲区，就像Mat一样。他们考虑了可能的数据共享。析构函数递减与矩阵数据缓冲区关联的引用计数器。当且仅当引用计数器达到零时，即当没有其他结构引用相同的缓冲区时，缓冲区被释放。同样，复制Mat实例时，实际上并未复制任何实际数据。相反，引用计数器递增以记住存在相同数据的另一个所有者。还有Mat :: clone方法可以创建矩阵数据的完整副本。请参阅以下示例：

// create a big 8Mb matrix
Mat A(1000, 1000, CV_64F);

// create another header for the same matrix;
// this is an instant operation, regardless of the matrix size.
Mat B = A;
// create another header for the 3-rd row of A; no data is copied either
Mat C = B.row(3);
// now create a separate copy of the matrix
Mat D = B.clone();
// copy the 5-th row of B to C, that is, copy the 5-th row of A
// to the 3-rd row of A.
B.row(5).copyTo(C);
// now let A and D share the data; after that the modified version
// of A is still referenced by B and C.
A = D;
// now make B an empty matrix (which references no memory buffers),
// but the modified version of A will still be referenced by C,
// despite that C is just a single row of the original A
B.release();

// finally, make a full copy of C. As a result, the big modified
// matrix will be deallocated, since it is not referenced by anyone
C = C.clone();

你看到Mat和其他基本结构的使用很简单。但是，如果不考虑自动内存管理而创建的高级类甚至用户数据类型呢？对于他们来说，OpenCV提供的Ptr <>模板类与C ++ TR1中的std :: shared_ptr类似。所以，而不是使用普通指针：

T* ptr = new T(...);

您可以使用：

Ptr<T> ptr = new T(...);

也就是说，Ptr <T> ptr封装指向T实例的指针和与指针相关联的引用计数器。有关详细信息，请参阅Ptr说明。

输出数据的自动分配

OpenCV自动释放内存，并在大多数时间自动为输出函数参数分配内存。因此，如果函数具有一个或多个输入数组（cv :: Mat实例）和一些输出数组，则会自动分配或重新分配输出数组。输出数组的大小和类型由输入数组的大小和类型决定。如果需要，函数会采用额外的参数来帮助确定输出数组属性。

例如：

#include "cv.h"
#include "highgui.h"

using namespace cv;

int main(int, char**)
{
    VideoCapture cap(0);
    if(!cap.isOpened()) return -1;

    Mat frame, edges;
    namedWindow("edges",1);
    for(;;)
    {
        cap >> frame;
        cvtColor(frame, edges, CV_BGR2GRAY);
        GaussianBlur(edges, edges, Size(7,7), 1.5, 1.5);
        Canny(edges, edges, 0, 30, 3);
        imshow("edges", edges);
        if(waitKey(30) >= 0) break;
    }
    return 0;
}

由于视频帧分辨率和比特深度对于视频捕获模块是已知的，所以阵列帧由 >> 运算符自动分配。数组边缘由cvtColor函数自动分配。它具有与输入数组相同的大小和位深度。通道数为1，因为颜色转换代码CV_BGR2GRAY被传递，这意味着颜色到灰度转换。请注意，在第一次执行循环体时，帧和边仅分配一次，因为所有下一个视频帧具有相同的分辨率。如果以某种方式更改视频分辨率，则会自动重新分配阵列。

该技术的关键组件是Mat :: create方法。它需要所需的数组大小和类型。如果数组已具有指定的大小和类型，则该方法不执行任何操作。否则，它释放先前分配的数据（如果有的话）（这部分涉及递减引用计数器并将其与零比较），然后分配所需大小的新缓冲区。大多数函数为每个输出数组调用Mat :: create方法，因此实现了自动输出数据分配。

这个方案的一些值得注意的例外是cv :: mixChannels，cv :: RNG :: fill，以及一些其他函数和方法。它们无法分配输出数组，因此您必须提前执行此操作。

饱和度算术

作为计算机视觉库，OpenCV对图像像素进行了大量处理，这些像素通常以紧凑的，每通道8位或16位编码形式，因此具有有限的值范围。此外，对图像的某些操作，如色彩空间转换，亮度/对比度调整，锐化，复杂插值（双立方，Lanczos）可以产生超出可用范围的值。如果只存储结果的最低8（16）位，则会导致视觉伪影，并可能影响进一步的图像分析。为了解决这个问题，使用所谓的饱和算术。例如，要将操作结果r存储到8位图像，您会在0..255范围内找到最接近的值：

$I(x,y)= \min ( \max (\textrm{round}(r), 0), 255)$

类似的规则适用于8位带符号的16位有符号和无符号类型。这种语义在库中的任何地方都使用。在C ++代码中，它使用类似于标准C ++强制转换操作的saturate_cast <>函数完成。见下文上面提供的公式的实施：

I.at<uchar>(y, x) = saturate_cast<uchar>(r);

其中cv :: uchar是OpenCV 8位无符号整数类型。在优化的SIMD代码中，使用诸如paddusb，packuswb等的SSE2指令。它们有助于实现与C ++代码完全相同的行为。

注意：当结果为32位整数时，不应用饱和度。

固定像素类型。模板的有限使用

模板是C ++的一个很好的特性，它可以实现非常强大，高效且安全的数据结构和算法。但是，广泛使用模板可能会大大增加编译时间和代码大小。此外，当专门使用模板时，很难将界面和实现分开。这对于基本算法来说可能很好，但对于计算机视觉库来说并不好，其中单个算法可能跨越数千行代码。正因为如此，并且还简化了其他语言的绑定开发，例如Python，Java，Matlab，它们根本没有模板或具有有限的模板功能，当前的OpenCV实现基于多态和模板上的运行时调度。在那些运行时调度速度太慢的地方（如像素访问运算符），不可能（通用Ptr <>实现），或者只是非常不方便（saturate_cast <>（））当前的实现引入了小模板类，方法和函数。在当前OpenCV版本的任何其他地方，模板的使用都是有限的。

因此，库可以操作有限的固定原始数据类型集。也就是说，数组元素应该具有以下类型之一：

8-bit unsigned integer (uchar)
8-bit signed integer (schar)
16-bit unsigned integer (ushort)
16-bit signed integer (short)
32-bit signed integer (int)
32-bit floating-point number (float)
64-bit floating-point number (double)
a tuple of several elements where all elements have the same type (one of the above). An array whose elements are such tuples, are called multi-channel arrays, as opposite to the single-channel arrays, whose elements are scalar values. The maximum possible number of channels is defined by the CV_CN_MAX constant, which is currently set to 512.（所有元素具有相同类型（上述之一）的几个元素的元组。元素为元组的数组称为多通道数组，与单通道数组相反，其元素为标量值。最大可能的通道数由CV_CN_MAX常量定义，该常量当前设置为512。)

对于这些基本类型，应用以下枚举：

enum { CV_8U=0, CV_8S=1, CV_16U=2, CV_16S=3, CV_32S=4, CV_32F=5, CV_64F=6 };

可以使用以下选项指定多通道（n通道）类型：

CV_8UC1 ... CV_64FC4常量（对于1到4的多个通道）
当通道数大于4或在编译时未知时，CV_8UC（n）... CV_64FC（n）或CV_MAKETYPE（CV_8U，n）... CV_MAKETYPE（CV_64F，n）宏。

注意：CV_32FC1 == CV_32F, CV_32FC2 == CV_32FC(2) == CV_MAKETYPE(CV_32F, 2), and CV_MAKETYPE(depth, n) == (depth&7) +((n-1)<<3). 这意味着常量类型由深度形成，取最低3位，通道数减1，取下一个log2（CV_CN_MAX）位。

例子：

Mat mtx(3, 3, CV_32F); // make a 3x3 floating-point matrix
Mat cmtx(10, 1, CV_64FC2); // make a 10x1 2-channel floating-point
                           // matrix (10-element complex vector)
Mat img(Size(1920, 1080), CV_8UC3); // make a 3-channel (color) image
                                    // of 1920 columns and 1080 rows.
Mat grayscale(image.size(), CV_MAKETYPE(image.depth(), 1)); // make a 1-channel image of
                                                            // the same size and same
                                                            // channel type as img

使用OpenCV无法构造或处理具有更复杂元素的数组。此外，每个函数或方法只能处理所有可能的数组类型的子集。通常，算法越复杂，支持的格式子集越小。请参阅以下这些限制的典型示例：

人脸检测算法仅适用于8位灰度或彩色图像。
线性代数函数和大多数机器学习算法仅适用于浮点数组。
基本功能，如cv :: add，支持所有类型
色彩空间转换功能支持8位无符号，16位无符号和32位浮点类型。

每个功能的受支持类型的子集已根据实际需要进行定义，并可根据用户请求在将来进行扩展。

InputArray和OutputArray

许多OpenCV函数处理密集的二维或多维数值数组。通常，这样的函数使用cpp：class：Mat作为参数，但在某些情况下，使用std :: vector <>（例如：点集）或Matx <>（例如：3x3单应矩阵等）更方便。为了避免API中的许多重复，引入了特殊的“代理”类。基础“代理”类是InputArray。它用于在函数输入上传递只读数组。从InputArray类派生的OutputArray用于指定函数的输出数组。通常，您不应该关心那些中间类型（并且您不应该明确声明这些类型的变量） - 它们都将自动运行。您可以假设您可以使用Mat，std :: vector <>，Matx <>，Vec <>或Scalar来代替InputArray / OutputArray。当一个函数有一个可选的输入或输出数组，并且参数没有你想要的任何一个时，传递cv :: noArray（）。

错误处理

OpenCV使用异常来表示严重错误。当输入数据格式正确且属于指定的值范围时，算法由于某种原因无法成功（例如，优化算法没有收敛），它返回一个特殊的错误代码（通常只是一个布尔变量）。

异常可以是cv :: Exception类或其派生类的实例。反过来，cv :: Exception是std :: exception的衍生物。因此，可以使用其他标准 C ++库组件在代码中优雅地处理它。

通常使用CV_Error（错误代码，描述）宏抛出异常，或其类似printf的CV_Error_（错误代码，printf-spec，（printf-args））变体，或使用CV_Assert（条件）宏检查条件，并在不满足时抛出异常。对于性能关键代码，CV_DbgAssert（条件）仅保留在Debug配置中。由于自动内存管理，所有中间缓冲区在发生突然错误时会自动解除分配。如果需要，您只需要添加try语句来捕获异常：

try
{
    ... // call OpenCV
}
catch( cv::Exception& e )
{
    const char* err_msg = e.what();
    std::cout << "exception caught: " << err_msg << std::endl;
}

多线程和Re-enterability（重新连接 /重新输入）

当前的OpenCV实现是完全可以重新输入的。也就是说，可以从不同的线程调用类实例的相同的函数，相同常量方法或者不同类实例的相同非常量方法（non-constant method）。此外，相同的cv :: Mat可以在不同的线程中使用，因为引用计数操作使用特定于体系结构的原子指令。

惜缘865

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenCV Introduction(译)

原文链接：https://blog.csdn.net/u011608180/article/details/84842086介绍¶OpenCV（开源计算机视觉库：http：//opencv.org）是一个开源的BSD许可库，包含数百种计算机视觉算法。该文档描述了所谓的OpenCV 2.x API，它本质上是一个C ++ API，与基于C的OpenCV 1.x API相反。后者在opencv...
复制链接

扫一扫