OpenCV矩阵上的掩码操作

人工智能小豪

已于 2024-01-25 21:08:58 修改

阅读量1.6k

点赞数 39

文章标签： opencv 矩阵人工智能计算机视觉

于 2024-01-21 09:30:00 首次发布

本文链接：https://blog.csdn.net/2301_81888214/article/details/135711892

版权

本文详细介绍了如何在C++中使用OpenCV实现图像对比度增强，通过手动编写和filter2D函数两种方法，并比较了它们的效率。作者展示了使用掩码矩阵和基本像素访问操作来增强图像的步骤。

摘要由CSDN通过智能技术生成

我们的测试用例

让我们考虑图像对比度增强方法的问题。基本上，我们想对图像的每个像素应用以下公式：

我( i，j）=5∗我( i，j）−[我(i−1，j)+我(i+1，j)+我( i，j−1)+我( i，j+1)]

⟺我( i，j）∗M，其中 M=我∖j−10+1−10−100−15−1+10−10

第一种表示法是使用公式，而第二种表示法是第一种表示法的压缩版本，使用掩码。通过将掩码矩阵的中心（大写字母表示为零-零索引）放在要计算的像素上，并将像素值乘以重叠的矩阵值相加来使用掩码。这是一回事，但是在大型矩阵的情况下，后一种符号更容易查看。

法典

C++爪哇岛蟒

您可以从此处下载此源代码，或查看位于的 OpenCV 源代码库示例目录。samples/cpp/tutorial_code/core/mat_mask_operations/mat_mask_operations.cpp

#include < opencv2/imgcodecs.hpp>

#include < opencv2/highgui.hpp>

#include < opencv2/imgproc.hpp>

#include < iostream>

使用命名空间 std;

使用命名空间 CV;

static void help（char* progName）

{

cout << endl

<< “这个程序展示了如何使用蒙版过滤图像：自己写和”

<< “filter2d 方式。<< endl

<< “用法：” << endl

<< progName << “ [image_path -- default lena.jpg] [G -- grayscale] ” << endl << endl;

}

无效锐化（const Mat&myImage，Mat&Result）;

int main（ int argc， char* argv[]）

{

帮助（argv[0]）;

const char* 文件名 = argc >=2 ？argv[1] ： “lena.jpg”;

垫子 src， dst0， dst1;

if （argc >= 3 && ！strcmp（“G”， argv[2]））

src = imread（ samples：：findFile（文件名）， IMREAD_GRAYSCALE);

还

src = imread（ samples：：findFile（文件名）， IMREAD_COLOR);

如果（src.空())

{

cerr << “无法打开图像 [” <<文件名<< “]” << endl;

返回EXIT_FAILURE;

}

namedWindow（“输入”， WINDOW_AUTOSIZE);

namedWindow（“输出”， WINDOW_AUTOSIZE);

imshow（ “输入”， src ）;

double t = （double）getTickCount();

锐化（ src， dst0 ）;

t = （（double）getTickCount（） - t）/getTickFrequency();

cout << “以秒为单位的手写函数时间：” << t << endl;

imshow（ “输出”， dst0 ）;

等待键();

垫核 = （Mat_<char>（3,3） << 0， -1， 0，

-1, 5, -1,

0, -1, 0);

t = （double）getTickCount();

filter2D（ src， dst1， src.depth（），内核）;

t = （（double）getTickCount（） - t）/getTickFrequency();

cout << “内置 filter2D 时间以秒为单位传递：” << t << endl;

imshow（ “输出”， dst1 ）;

等待键();

返回EXIT_SUCCESS;

}

无效锐化（const Mat&myImage，Mat&Result）

{

CV_Assert（myImage.深度（） == CV_8U）;仅接受 uchar 图像

const int nChannels = myImage。渠道();

结果。创建（myImage.size（），myImage。类型());

for（int j = 1 ; j < myImage.行-1;++j）

{

const uchar* previous = myImage。PTR<uchar>（J-1）;

const uchar* current = myImage。PTR<uchar>（J）;

const uchar* next = myImage。PTR<uchar>（J+1）;

uchar* 输出 = 结果。PTR<uchar>（j）;

for（int i= nChannels;我< nChannels*（myImage.cols-1）;++i）

{

输出[i] = saturate_cast<uchar>（5*current[i]

-current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;

}

}

结果。行（0）中。setTo（标量（0））;

结果。row（结果。rows-1）。setTo（标量（0））;

结果。col（0）中。setTo（标量（0））;

结果。col（结果。cols-1）。setTo（标量（0））;

}

基本方法

C++爪哇岛蟒

现在让我们看看如何通过使用基本的像素访问方法或使用 filter2D（） 函数来实现这一点。

下面是一个函数可以做到这一点：

无效锐化（const Mat&myImage，Mat&Result）

{

CV_Assert（myImage.depth（） == CV_8U）;仅接受 uchar 图像

const int nChannels = myImage.channels（）;

结果.create（myImage.size（），myImage.type（））;

for（int j = 1 ; j < myImage.rows-1; ++j）

{

const uchar* 前 = myImage.ptr<uchar>（j - 1）;

const uchar* 当前 = myImage.ptr<uchar>（j ）;

const uchar* next = myImage.ptr<uchar>（j + 1）;

uchar* 输出 = Result.ptr<uchar>（j）;

for（int i= nChannels;i < nChannels*（myImage.cols-1）;++i）

{

输出[i] = saturate_cast<uchar>（5*current[i]

-current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;

}

}

结果.row（0）.setTo（标量（0））;

结果.row（Result.rows-1）.setTo（标量（0））;

结果.col（0）.setTo（标量（0））;

结果.col（Result.cols-1）.setTo（标量（0））;

}

首先，我们确保输入图像数据是无符号字符格式。为此，我们使用 cv：：CV_Assert 函数，当其中的表达式为 false 时，该函数会抛出错误。

CV_Assert（myImage.depth（） == CV_8U）;仅接受 uchar 图像

我们创建一个与输入具有相同大小和类型的输出图像。正如您在存储部分中看到的，根据通道的数量，我们可能有一个或多个子列。

我们将通过指针遍历它们，因此元素的总数取决于这个数字。

const int nChannels = myImage.channels（）;

结果.create（myImage.size（），myImage.type（））;

我们将使用普通的 C [] 运算符来访问像素。由于我们需要同时访问多行，因此我们将获取每行的指针（上一行、当前行和下一行）。我们需要另一个指向要保存计算位置的指针。然后，只需使用 [] 运算符访问正确的项目即可。为了向前移动输出指针，我们只需在每次操作后增加此值（增加一个字节）：

for（int j = 1 ; j < myImage.rows-1; ++j）

{

const uchar* 前 = myImage.ptr<uchar>（j - 1）;

const uchar* 当前 = myImage.ptr<uchar>（j ）;

const uchar* next = myImage.ptr<uchar>（j + 1）;

uchar* 输出 = Result.ptr<uchar>（j）;

for（int i= nChannels;i < nChannels*（myImage.cols-1）;++i）

{

输出[i] = saturate_cast<uchar>（5*current[i]

-current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;

}

}

在图像的边框上，上部符号导致不存在的像素位置（如负一 - 负一）。在这些方面，我们的公式是不确定的。一个简单的解决方案是不要在这些点上应用内核，例如，将边框上的像素设置为零：

结果.row（0）.setTo（标量（0））;

结果.row（Result.rows-1）.setTo（标量（0））;

结果.col（0）.setTo（标量（0））;

结果.col（Result.cols-1）.setTo（标量（0））;

filter2D 函数

C++爪哇岛蟒

应用这种过滤器在图像处理中非常普遍，以至于在 OpenCV 中有一个函数可以处理应用掩码（在某些地方也称为内核）。为此，您首先需要定义一个包含掩码的对象：

垫核 = （Mat_<char>（3,3） << 0， -1， 0，

-1, 5, -1,

0, -1, 0);

然后调用 filter2D（） 函数，指定要使用的输入、输出图像和内核：

filter2D（ src， dst1， src.depth（），内核）;

该函数甚至还有第五个可选参数来指定内核的中心，第六个参数用于在将过滤后的像素存储在 K 中之前向它们添加可选值，第七个参数用于确定在操作未定义（边界）的区域中要执行的操作。

此函数更短、更不冗长，并且由于进行了一些优化，因此通常比手动编码的方法更快。例如，在我的测试中，第二个只用了 13 毫秒，而第一个只用了大约 31 毫秒。有很大的不同。

例如：

结果MatMaskFilter2D.png

在线教程

麻省理工学院人工智能视频教程 – 麻省理工人工智能课程
人工智能入门 – 人工智能基础学习。Peter Norvig举办的课程
EdX 人工智能 – 此课程讲授人工智能计算机系统设计的基本概念和技术。
人工智能中的计划 – 计划是人工智能系统的基础部分之一。在这个课程中，你将会学习到让机器人执行一系列动作所需要的基本算法。
机器人人工智能 – 这个课程将会教授你实现人工智能的基本方法，包括：概率推算，计划和搜索，本地化，跟踪和控制，全部都是围绕有关机器人设计。
机器学习 – 有指导和无指导情况下的基本机器学习算法
机器学习中的神经网络 – 智能神经网络上的算法和实践经验
斯坦福统计学习

有需要的小伙伴，可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

请添加图片描述

人工智能书籍

第一阶段：零基础入门（3-6个月）

新手应首先通过少而精的学习，看到全景图，建立大局观。 通过完成小实验，建立信心，才能避免“从入门到放弃”的尴尬。因此，第一阶段只推荐4本最必要的书（而且这些书到了第二、三阶段也能继续用），入门以后，在后续学习中再“哪里不会补哪里”即可。

第二阶段：基础进阶（3-6个月）

熟读《机器学习算法的数学解析与Python实现》并动手实践后，你已经对机器学习有了基本的了解，不再是小白了。这时可以开始触类旁通，学习热门技术，加强实践水平。在深入学习的同时，也可以探索自己感兴趣的方向，为求职面试打好基础。

第三阶段：工作应用

这一阶段你已经不再需要引导，只需要一些推荐书目。如果你从入门时就确认了未来的工作方向，可以在第二阶段就提前阅读相关入门书籍（对应“商业落地五大方向”中的前两本），然后再“哪里不会补哪里”。

有需要的小伙伴，可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述

人工智能小豪

关注

39
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
OpenCV矩阵上的掩码操作

current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;-current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;-current[i-nChannels] - current[i+nChannels] - 上一个[i] - 下一个[i]）;我( i，j）=5∗我( i，j）−[我(i−1，j)+我(i+1，j)+我( i，j−1)+我( i，j+1)]
复制链接

扫一扫