opencv学习笔记(一)

前言

本文为本人观看b站视频学习opencv的笔记分享,如有错误欢迎指正,如有侵权联系我删除,视频链接

一、Read Images Videos and Webcams

#include<opencv2/imgcodecs.hpp>
#include<opencv2/highgui.hpp>
#include<opencv2/imgproc.hpp>
#include<iostream>

using namespace std;
using namespace cv;

/// <summary>
/// Images
/// </summary>
//void main() {
//	string path = "Resources/test.png";
//	Mat img=imread(path);//matrix data type 由opencv引入来处理图像
//	imshow("Image", img);
//	waitKey(0);//增加延时,0表示无穷
//}


/// <summary>
/// Video
/// //视频是一系列图像,需要遍历所有图像或帧 一一捕获并显示,因此将使用while循环
/// </summary>
//void main() {
//	string path = "Resources/test_video.mp4";
//	VideoCapture cap(path);
//	Mat img;
//
//	while (true) {
//		cap.read(img);
//		imshow("Image", img);
//		waitKey(20);//增加延时 20ms
//	}
//	
//}

/// <summary>
/// Webcam
/// 与导入视频不同的是,不需要视频路径,只需要给相机ID,id=0表示默认的摄像头
/// </summary>
//void main() {
//	VideoCapture cap(0);//相机id=0
//	Mat img;
//
	//while (true) {
	//	cap.read(img);
	//	imshow("Image", img);
	//	waitKey(1);//增加延时 1ms,以免太慢
	//}
//
//}

二、Basic Functions

1、颜色空间变换
函数原型

void cv::cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0)

参数详解

1.src:
类型:InputArray(Python中为图像ndarray对象,C++中为cv::InputArray)。
说明:这是要进行颜色空间转换的原始图像。在Python中,通常使用cv2.imread()函数读取的图像作为输入。需要注意的是,OpenCV默认读取的图像颜色空间是BGR,而不是常见的RGB。
2.dst(可选):
类型:OutputArray(Python中为图像ndarray对象,C++中为cv::OutputArray)。
说明:这是颜色空间转换后的输出图像。如果提供了这个参数,转换后的图像将被存储在这里。如果不提供,OpenCV将自动分配内存来存储转换后的图像。
3.code:
类型:int。
说明:这是颜色空间转换的标识符,指定了源图像和目标图像之间的转换类型。例如,cv2.COLOR_BGR2GRAY用于将BGR图像转换为灰度图像,cv2.COLOR_BGR2HSV用于将BGR图像转换为HSV图像等。OpenCV支持多种颜色空间转换类型,具体可以在OpenCV的官方文档中查找。
4.dstCn(可选,默认为0):
类型:int。
说明:这是输出图像的通道数。如果设置为0,则通道数将由输入图像和转换类型自动确定。对于大多数转换,这个参数可以省略。

在这里插入图片描述
2、高斯滤波
函数原型

void cv::GaussianBlur(InputArray src, OutputArray dst, Size ksize, double sigmaX, double sigmaY=0, int borderType=BORDER_DEFAULT)

参数详解

1.src:
类型:InputArray(Python)或cv::InputArray(C++)。
说明:要进行高斯滤波的输入图像。可以是任意通道数,但图像深度必须为CV_8U、CV_16U、CV_16S、CV_32F或CV_64F。
2.dst:
类型:OutputArray(Python)或cv::OutputArray(C++)。
说明:输出图像,与输入图像有相同的类型和尺寸。如果为None(Python)或未指定(C++),则函数会自动分配内存。
3.ksize:
类型:Size(Python和C++)。
说明:高斯核的大小,即卷积核的宽和高。这两个值必须是正奇数,如(3,3)(5,5)(7,7)等。如果ksize.width和ksize.height都为0,则它们的值将由sigma参数计算得出。
4.sigmaX:
类型:double。
说明:高斯核在X方向上的标准差。它决定了高斯核在X方向上的宽度。如果sigmaY为0,则sigmaY将与sigmaX相同。
5.sigmaY(可选):
类型:double。
说明:高斯核在Y方向上的标准差。如果未指定(在Python中为省略,在C++中默认为0),则sigmaY将与sigmaX相同。如果sigmaX和sigmaY都为0,则这两个值将由ksize.width和ksize.height计算得出。
6.borderType(可选):
类型:int。
说明:边界处理方式。决定了图像边界外的像素如何推断。有默认值BORDER_DEFAULT,如果没有特殊需要,通常不需要更改。其他常见的选项包括cv2.BORDER_CONSTANT(填充0)、cv2.BORDER_REPLICATE(边缘复制)、cv2.BORDER_REFLECT(边缘反射)等。

在这里插入图片描述
3、边缘检测
函数原型

void cv::Canny(InputArray image, OutputArray edges, double lowThreshold, double highThreshold, int apertureSize=3, bool L2gradient=false)

参数详解

1.image:
类型:InputArray 输入图像,应该是单通道8位图像(灰度图)。
说明:待处理的源图像,需要先进行灰度化处理,因为Canny算法是在灰度图像上进行的。
2.edges:
类型:OutputArray 输出图像,与输入图像具有相同的尺寸和类型。
说明:边缘检测的结果图像,图像中的边缘将被高亮显示。
3.lowThreshold:
类型:double 第一个滞后性阈值(低阈值)。
说明:像素的梯度值如果低于此阈值,则被视为非边缘像素。此阈值的选择影响边缘检测的灵敏度。
4.highThreshold:
类型:double 第二个滞后性阈值(高阈值)。
说明:像素的梯度值如果高于此阈值,则被视为边缘像素。此阈值的选择影响边缘检测的准确性。高阈值通常是低阈值的23倍。
5.apertureSize(可选):
默认值:3
类型:int Sobel算子的孔径大小。
说明:用于计算图像梯度的Sobel算子的大小。较大的孔径可以提高边缘检测的准确性,但也会增加计算量。
6.L2gradient(可选):
默认值:false
类型:bool 计算图像梯度幅值的标识。
说明:当此参数为true时,使用更精确的欧几里得距离(L2范数)来计算梯度值;当为false时,使用简化的L1范数计算梯度值。使用L2范数可以获得更精确的梯度值,但计算量较大。

在这里插入图片描述
4、扩张边缘
函数原型

void cv::dilate(InputArray src, OutputArray dst,   
                InputArray kernel,   
                Point anchor=Point(-1,-1),   
                int iterations=1,   
                int borderType=BORDER_CONSTANT,   
                const Scalar& borderValue=morphologyDefaultBorderValue() );

参数详解

1.src:
类型:InputArray
描述:输入图像,可以是单通道或多通道的灰度图像或彩色图像。图像的通道数量可以是任意的,但深度(数据类型)必须是CV_8U、CV_16U、CV_16S、CV_32F或CV_64F中的一种。
2.dst:
类型:OutputArray
描述:输出图像,与源图像具有相同的大小和类型。膨胀操作的结果将存储在这个图像中。
3.kernel:
类型:InputArray
描述:膨胀核(结构元素),用于指定膨胀操作的形状和尺寸。核可以是自定义的,也可以使用getStructuringElement函数来生成。如果未指定(即传递Mat()),则默认使用一个3x3的矩形核。
4.anchor:
类型:Point
默认值:Point(-1,-1)
描述:锚点的位置,决定了结构元素在进行膨胀时的参考位置。默认情况下,锚点位于结构元素的中心。
5.iterations:
类型:int
默认值:1
描述:膨胀操作的迭代次数。每次迭代都会将边缘进一步扩张。
6.borderType:
类型:int
默认值:BORDER_CONSTANT
描述:像素外推方法,用于处理边界像素。不同的方法会影响边界像素的处理方式。
7.borderValue:
类型:const Scalar&
默认值:morphologyDefaultBorderValue()
描述:在边界像素外推时使用的值,仅当borderType=BORDER_CONSTANT时有效。

在这里插入图片描述
5、侵蚀边缘
函数原型

void cv::erode(InputArray src, OutputArray dst,   
               InputArray kernel,   
               Point anchor=Point(-1,-1),   
               int iterations=1,   
               int borderType=BORDER_CONSTANT,   
               const Scalar& borderValue=morphologyDefaultBorderValue() );

参数详解

1.src:
类型:InputArray
描述:输入图像,即源图像,可以是单通道或多通道的灰度图像或彩色图像。图像的通道数量可以是任意的,但深度(数据类型)必须是CV_8U、CV_16U、CV_16S、CV_32F或CV_64F中的一种。
2.dst:
类型:OutputArray
描述:输出图像,与源图像具有相同的大小和类型。腐蚀操作的结果将存储在这个图像中。
3.kernel:
类型:InputArray
描述:腐蚀核(结构元素),用于指定腐蚀操作的形状和尺寸。核可以是自定义的,也可以使用getStructuringElement函数来生成。如果未指定(即传递Mat()),则默认使用一个3x3的矩形核。
4.anchor:
类型:Point
默认值:Point(-1,-1)
描述:锚点的位置,决定了结构元素在进行腐蚀时的参考位置。默认情况下,锚点位于结构元素的中心。
5.iterations:
类型:int
默认值:1
描述:腐蚀操作的迭代次数。每次迭代都会进一步腐蚀图像中的高亮区域。
6.borderType:
类型:int
默认值:BORDER_CONSTANT
描述:像素外推方法,用于处理边界像素。不同的方法会影响边界像素的处理方式。
7.borderValue:
类型:const Scalar&
默认值:morphologyDefaultBorderValue()
描述:在边界像素外推时使用的值,仅当borderType=BORDER_CONSTANT时有效。

在这里插入图片描述
使用示例

#include<opencv2/imgcodecs.hpp>
#include<opencv2/highgui.hpp>
#include<opencv2/imgproc.hpp>
#include<iostream>

using namespace std;
using namespace cv;

/// <summary>
/// Basic Function
/// </summary>
//void main() {
//	string path = "Resources/test.png";
//	Mat img=imread(path);//matrix data type 由opencv引入来处理图像
//	Mat imgGray,imgBlur,imgCanny,imgDil,imgErode;
//
//	cvtColor(img, imgGray, COLOR_BGR2GRAY);//cvt是convert的缩写,将图像从一种颜色空间转换为另一种颜色空间。
//	GaussianBlur(imgGray, imgBlur,Size(7,7),5,0);//使用高斯滤波器模糊图像。该函数将源图像与指定的高斯核进行卷积,Size(7,7)是核大小,数字越大越模糊
//	Canny(imgBlur, imgCanny, 25, 75);//边缘检测,阈值1,2可调,目的:显示更多的边缘
//	
//	Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3));//创建一个核,增加Size(只能是奇数)会扩张/侵蚀更多
//	dilate(imgCanny, imgDil, kernel);//扩张边缘(增加边缘厚度)
//	erode(imgDil, imgErode, kernel);//侵蚀边缘(减小边缘厚度)
//	imshow("Image", img);
//	imshow("Image Gray", imgGray);
//	imshow("Image Blur", imgBlur);
//	imshow("Image Canny", imgCanny);
//	imshow("Image Dilation", imgDil);
//	imshow("Image Erode", imgErode);
//	waitKey(0);//增加延时,0表示无穷
//}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值