OpenCV模板匹配

人工智能小豪

已于 2024-05-05 14:03:05 修改

阅读量1k

点赞数 33

文章标签： opencv 人工智能计算机视觉

于 2024-02-18 09:15:00 首次发布

本文链接：https://blog.csdn.net/2301_81888214/article/details/136135271

版权

目标

在本教程中，您将学习如何：

使用 OpenCV 函数 matchTemplate（） 搜索图像补丁和输入图像之间的匹配项
使用 OpenCV 函数 minMaxLoc（） 查找给定数组中的最大值和最小值（以及它们的位置）。

理论

什么是模板匹配？

模板匹配是一种用于查找图像中与模板图像（补丁）匹配（相似）的区域的技术。

虽然补丁必须是矩形，但并非所有矩形都是相关的。在这种情况下，可以使用掩码来隔离补丁中用于查找匹配项的部分。

它是如何工作的？

我们需要两个主要组件：
1. **源图片（I）：**我们希望在其中找到与模板图像匹配的图像
2. **模板图片（T）：**将与源映像进行比较的修补程序映像
我们的目标是检测最高匹配区域：
为了识别匹配区域，我们必须通过滑动模板图像与源图像进行比较：
滑动是指一次移动一个像素（从左到右，从上到下）。在每个位置，都会计算一个指标，以便它表示该位置的匹配度的“好”或“坏”程度（或补丁与源图像的特定区域的相似程度）。
对于 T over I 的每个位置，将指标存储在结果矩阵 R 中。R 中的每个位置都包含匹配指标：(x，y)

上图是用公制TM_CCORR_NORMED滑动补丁的结果 R。最亮的位置表示匹配度最高。如您所见，红色圆圈标记的位置可能是具有最高值的位置，因此该位置（由该点形成的矩形作为角，宽度和高度等于贴片图像）被视为匹配项。
在实践中，我们使用函数 minMaxLoc（） 在 R 矩阵中定位最高值（或更低，取决于匹配方法的类型）

面膜是如何工作的？

如果匹配需要遮罩，则需要三个组件：
1. **源图片（I）：**我们希望在其中找到与模板图像匹配的图像
2. **模板图片（T）：**将与源映像进行比较的修补程序映像
3. **蒙版图像（M）：**蒙版，遮罩模板的灰度图像
目前只有两种匹配方法接受掩码：TM_SQDIFF 和 TM_CCORR_NORMED（有关 opencv 中可用的所有匹配方法的说明，请参见下文）。
蒙版的尺寸必须与模板相同
蒙版应具有CV_8U或CV_32F深度，并且通道数应与模板图像相同。CV_8U情况下，掩码值被视为二进制值，即零和非零。CV_32F情况下，这些值应落在 [0…1] 范围内，模板像素将乘以相应的掩码像素值。由于示例中的输入图像具有CV_8UC3类型，因此蒙版也被视为彩色图像。

OpenCV中有哪些匹配方法？

问得好。OpenCV 在函数 matchTemplate（） 中实现了模板匹配。可用的方法有 6 种：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

法典 C++爪哇岛蟒

这个程序是做什么的？
- 加载输入图像、图像修补程序（模板）和（可选）蒙版
- 通过使用 OpenCV 函数 matchTemplate（） 和前面描述的 6 种匹配方法中的任何一种来执行模板匹配过程。用户可以通过在跟踪栏中输入选择来选择方法。如果提供了掩码，则它只会用于支持掩码的方法
- 规范化匹配过程的输出
- 以更高的匹配概率定位位置
- 在与最高匹配对应的区域周围绘制一个矩形
可下载代码：点击这里
代码一览：

#include“opencv2/imgcodecs.hpp”

#include “opencv2/highgui.hpp”

#include“opencv2/imgproc.hpp”

#include < iostream>

使用命名空间 std;

使用命名空间 CV;

布尔use_mask;

垫子img;垫子模板;垫面膜;垫子结果;

const char* image_window = “源图像”;

const char* result_window = “结果窗口”;

int match_method;

整数 max_Trackbar = 5;

无效MatchingMethod（ int， void* );

const char* 键 =

“{ 帮助 h| |打印帮助消息。}"

“{ @input1 |Template_Matching_Original_Image.jpg |image_name}”

“{ @input2 |Template_Matching_Template_Image.jpg |template_name }”

“{ @input3 | |mask_name }”;

int main（ int argc， char** argv ）

{

CommandLineParser 解析器（ argc， argv， keys ）;

samples：：addSamplesDataSearchSubDirectory（ “doc/tutorials/imgproc/histograms/template_matching/images” );

img = imread（ samples：：findFile（ parser.get<String>（“@input1”) ) );

templ = imread（ samples：：findFile（ parser.get<String>（“@input2”））， IMREAD_COLOR );

if（argc > 3） {

use_mask = 真;

mask = imread（samples：：findFile（ parser.get[>（“@input3”））， IMREAD_COLOR );

}

if（img.empty（） ||模板。empty（） ||（use_mask & 掩码。空()))

{

cout <<“无法阅读其中一张图像”<<结束;

返回EXIT_FAILURE;

}

namedWindow（ image_window， WINDOW_AUTOSIZE );

namedWindow（ result_window， WINDOW_AUTOSIZE );

const char* trackbar_label = “方法： \n 0： SQDIFF \n 1： SQDIFF 规范 \n 2： TM CCORR \n 3： TM CCORR NORMED \n 4： TM COEFF \n 5： TM COEFF 规范”;

createTrackbar（ trackbar_label， image_window， &match_method， max_Trackbar， MatchingMethod ）;

Matching方法（ 0， 0 ）;

waitKey（0）;

返回EXIT_SUCCESS;

}

无效MatchingMethod（ int， void* )

{

垫子img_display;

图片。copyTo（ img_display ）;

int result_cols = img。科尔斯 - 模板。科尔斯 + 1;

int result_rows = img。行 - 模板。行数 + 1;

结果。create（ result_rows， result_cols， CV_32FC1 );

bool method_accepts_mask = （TM_SQDIFF == match_method || match_method == TM_CCORR_NORMED);

如果（use_mask & method_accepts_mask）

{ matchTemplate（ img， templ， result， match_method， mask）;}

还

{ matchTemplate（ img， templ， result， match_method）;}

normalize（ result， result， 0， 1， NORM_MINMAX， -1， Mat() );

双minVal;双倍最大Val;点 minLoc;点 maxLoc;

点匹配 Loc;

minMaxLoc（结果， &minVal， &maxVal， &minLoc， &maxLoc， Mat() );

if（ match_method == TM_SQDIFF || match_method == TM_SQDIFF_NORMED )

{ matchLoc = minLoc;

还

{ matchLoc = 最大 Loc;

rectangle（ img_display， matchLoc， Point（ matchLoc.x + 模板。cols ， matchLoc.y + 模板。rows ）， Scalar：：all（0）， 2， 8， 0 ）;

rectangle（ result， matchLoc， Point（ matchLoc.x + 模板。cols ， matchLoc.y + 模板。rows ）， Scalar：：all（0）， 2， 8， 0 ）;

imshow（ image_window， img_display ）;

imshow（ result_window，结果）;

返回;

}

解释 C++爪哇岛蟒

声明一些全局变量，例如图像、模板和结果矩阵，以及匹配方法和窗口名称：

布尔use_mask;

垫子img;垫子模板;垫面膜;垫子结果;

const char* image_window = “源图像”;

const char* result_window = “结果窗口”;

int match_method;

整数 max_Trackbar = 5;

加载源图像、模板，以及（如果匹配方法支持）蒙版（可选）：

img = imread（ samples：：findFile（ parser.get<String>（“@input1”) ) );

templ = imread（ samples：：findFile（ parser.get<String>（“@input2”））， IMREAD_COLOR );

if（argc > 3） {

use_mask = 真;

mask = imread（samples：：findFile（ parser.get[>（“@input3”））， IMREAD_COLOR );

}

if（img.empty（） || templ.empty（） ||（use_mask && mask.empty（）））

{

cout <<“无法阅读其中一张图像”<<结束;

返回EXIT_FAILURE;

}

创建跟踪栏以输入要使用的匹配方法类型。当检测到更改时，将调用回调函数。

const char* trackbar_label = “方法： \n 0： SQDIFF \n 1： SQDIFF 规范 \n 2： TM CCORR \n 3： TM CCORR NORMED \n 4： TM COEFF \n 5： TM COEFF 规范”;

createTrackbar（ trackbar_label， image_window， &match_method， max_Trackbar， MatchingMethod ）;
让我们来看看回调函数。首先，它创建源图像的副本：

垫子img_display;

img.copyTo（ img_display ）;

执行模板匹配操作。参数自然是输入图像 I、模板 T、结果 R 和 match_method（由 Trackbar 给出），以及可选的掩码图像 M。

bool method_accepts_mask = （TM_SQDIFF == match_method || match_method == TM_CCORR_NORMED);

如果（use_mask & method_accepts_mask）

{ matchTemplate（ img， templ， result， match_method， mask）;}

还

{ matchTemplate（ img， templ， result， match_method）;}

我们对结果进行归一化：

normalize（ result， result， 0， 1， NORM_MINMAX， -1， Mat（））;
我们使用 minMaxLoc（） 在结果矩阵 R 中定位最小值和最大值。

双minVal;双倍最大Val;点 minLoc;点 maxLoc;

点匹配 Loc;

minMaxLoc（结果， &minVal， &maxVal， &minLoc， &maxLoc， Mat（））;
对于前两种方法（TM_SQDIFF 和 MT_SQDIFF_NORMED ），最佳匹配是最低值。对于所有其他值，值越高表示匹配越好。因此，我们将相应的值保存在 matchLoc 变量中：

if（ match_method == TM_SQDIFF || match_method == TM_SQDIFF_NORMED )

{ matchLoc = minLoc;

还

{ matchLoc = 最大 Loc;

显示源图像和结果矩阵。在尽可能高的匹配区域周围绘制一个矩形：

rectangle（ img_display， matchLoc， Point（ matchLoc.x + templ.cols ， matchLoc.y + templ.rows ）， Scalar：：all（0）， 2， 8， 0 ）;

rectangle（ result， matchLoc， Point（ matchLoc.x + templ.cols ， matchLoc.y + templ.rows ）， Scalar：：all（0）， 2， 8， 0 ）;

imshow（ image_window， img_display ）;

imshow（ result_window，结果）;

结果

使用输入图像测试我们的程序，例如：

和模板图像：
生成以下结果矩阵（第一行是标准方法 SQDIFF、CCORR 和 CCOEFF，第二行是规范化版本中的相同方法）。在第一列中，最暗是更好的匹配，对于其他两列，位置越亮，匹配度越高。

Result_0

Result_1

Result_2

Result_3

Result_4

Result_5
右边的匹配如下所示（右边的人脸周围的黑色矩形）。请注意，CCORR 和 CCDEFF 给出了错误的最佳匹配，但是它们的规范化版本做对了，这可能是因为我们只考虑了“最高匹配”，而不是其他可能的高匹配。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述