OpenCV环境搭建:
下载,安装,自行百度,这里只写些自己配置环境的经验
VS下视图选项,属性管理器
如下配置:
包含目录:
库目录:
链接文件(输入):
个人是创建项目搭建好环境后,把配置文件拿了出来:
好处是下次可以直接使用该配置文件所规定的环境,不用再次配置如上环境
OpenCV简介:
简单来说是C和C++编写的跨平台中高层API,主要用于图像处理类项目,开源,免费,不过里面有些商业算法,打包时慎用(一般接触不到)
OpenCv基本架构(建议熟悉了解):
calib3d:相机校准,三维重建
contrib:人脸识别,立体匹配,人工视网膜模型等
core:核心功能模块,包括一些基本数据结构,动态数据结构,绘图,数组操作函数,与OpenGL的互操作
imgproc:Image,Process,图像,处理模块
features2D:2D功能框架,各种特征检测,描述符操作等
flann:高维的近似近邻快速搜索算法库,包括聚类和快速近似最近邻搜索
gpu:运用GPU加速的计算机视觉模块
highgui:高层GUI加速的计算机视觉模块
legacy:用不到,废弃的代码库,保留下来,向下兼容用
ml:机器学习模块,基本是统计模型,和分类算法
nonfree:专利算法模块,慎用
objdetect:目标检测模块
ocl:运用OpenCL加速的计算机视觉组件模块
photo:图像修复和图像去噪
stitching:图像拼接模块
superres:超分辨率技术
ts:OpenCV测试相关代码,不用管
video:视频分析组件,包括运动估计,背景分离,对象跟踪等视频处理相关技术
Videostab:视频稳定相关的组件,不用管
Mat对象介绍:
顾名思义Mat对象,矩阵对象,在OpenCV中图像的存储基本上都是以矩阵的概念存储。
Mat对象包含两部分:矩阵头(包含信息有矩阵的大小,用于存储的方法,矩阵存储的地址等)
指向矩阵的指针(包含像素值的矩阵)
*像素值:颜色空间和数据类型
这种概念的好处是,可以有两个Mat对象指向同一个矩阵,毕竟矩阵的存储在内存中,无论是在时间或空间都是一件不容易的事。
Mat img = imread("E://hashiqi.jpg");
Mat b;
img = b;
Mat c(img);
以上方式都是共享图像数据,一个对象对图片进行改动,保存,波及其他对象,即赋值运算符和复制构造函数 (构造函数)只复制头。
真正的把图像数据复制给另一个对象的方法是使用clone () 或copyTo () 函数将复制的图像的基础矩阵。
(函数原型中的InputArray/OutputArray都简单当做Mat对象)
Mat img = imread("E://hashiqi.jpg");
Mat b = img.clone();
Mat c;
img.copyTo(c);
在OpenCv中,通过图片生成Mat对象的方法是cv::imread 加载图像文件成为一个mat对象
imread(文件名,图像类型)
IMREAD_UNCHANGED 加载原图(新版本中该标志已经废置)
IMREAD_GRAYSCALE 把原图作为灰度图像加载进来
IMREAD_COLOR 把原图作为RGB图像加载进来
Mat img;
img = imread("E://hashiqi.jpg");
通过Mat对象显示图像的方法是cv::imshow
imshow("原图", img);
通过Mat写入图像
通过Mat的 <<运算符,将矩阵写到一个图像文件,仅适用于二维矩阵。
数据结构参数命名定义:CV_ [每一项的位数] [有符号或无符号] [类型前缀] C [通道数];
一般图像结构参数:CV_8UC1,CV_8UC2,CV_8UC3, CV_8UC4(Unsigned 8bits);
Mat M(2,2, CV_8UC3, Scalar(0,0,255));
Scalar 是四个元素短向量。指定此和可以初始化所有矩阵点与自定义的值。
Mat::eyes(单位矩阵),Mat::ones(全1矩阵),Mat::zeros(零矩阵)
一些常用的数据类型:
Point2f,Point3f,顾名思义二维点,三维点,p(x,y),p3(x,y,z)
定义和输出基于Mat的std::vector,正常的变长数组在opencv中可以这样用,Mat(v);
关于图像的基本知识
灰度图像:黑,白
彩色图像:RGB,编写代码的一种颜色的透明度有时第四个元素: 添加 alpha (A)。
图像的色彩空间常用的有BGR和HSV
BGR:顾名思义,三基色blue,green,red,与人眼成像元色一致,OpenCV中大多数图像的色彩空间都应该是BGR
HSV:HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。色调H用角度度量,取值范围为0°~360°,S表示饱和度,也就是色彩的深浅度(0-100%) ,V表示色彩的亮度(0-100%) 。
H:色相(颜色)S:饱和度(类似于淡红,普通红,深红) V:亮度(明度)
下面是BGR图像色彩空间转HSV色彩空间,并在控制台打印出像素的具体参数
using namespace std;
using namespace cv;
//回调函数的函数声明
void on_mouse(int EVENT, int x, int y, int flags, void* userdata);
int main(int argc, char** argv)
{
Mat src, hsv;
//此处更改图片地址
src = imread("E://hashiqi.jpg");
namedWindow("display");
//捕捉指定窗口的鼠标信息
setMouseCallback("display", on_mouse, &src);
while (1)
{
imshow("display", src);
//waitKey,等待键盘输入,防止图片一闪而过
waitKey(40);
}
}
//void*可赋值成任何类型的指针
//通常情况下不要解指针,毕竟void*
void on_mouse(int EVENT, int x, int y, int flags, void* userdata)
{
Mat rgb, hsv;
rgb = *(Mat*)userdata;
Mat temp;
cvtColor(*(Mat*)userdata, hsv, COLOR_BGR2HSV);
Point p(x, y);
switch (EVENT)
{
//case 鼠标点击
case EVENT_LBUTTONDOWN:
{
printf("b=%d\t", rgb.at<Vec3b>(p)[0]);
printf("g=%d\t", rgb.at<Vec3b>(p)[1]);
printf("r=%d\n", rgb.at<Vec3b>(p)[2]);
printf("H=%d\t", hsv.at<Vec3b>(p)[0]);
printf("S=%d\t", hsv.at<Vec3b>(p)[1]);
printf("V=%d\n", hsv.at<Vec3b>(p)[2]);
circle(rgb, p, 2, Scalar(255), 3);
}
break;
}
}
(备注用cv_BGR2HSV要加type头文件,建议使用COLOR_BGR2HSV)
HSV参数值变动对图像的影响:
#include<opencv2/core.hpp>
#include<opencv2/highgui.hpp>
#include<opencv2/imgproc.hpp>
using namespace cv;
#include<iostream>
#include<string>
using namespace std;
//输入图像
Mat img;
//灰度值归一化
Mat bgr;
//HSV图像
Mat hsv;
//色相
int hmin = 0;
int hmin_Max = 360;
int hmax = 360;
int hmax_Max = 360;
//饱和度
int smin = 0;
int smin_Max = 255;
int smax = 255;
int smax_Max = 255;
//亮度
int vmin = 106;
int vmin_Max = 255;
int vmax = 250;
int vmax_Max = 255;
//显示原图的窗口
string windowName = "src";
//输出图像的显示窗口
string dstName = "dst";
//输出图像
Mat dst;
//回调函数
void callBack(int, void*)
{
//输出图像分配内存
dst = Mat::zeros(img.size(), CV_32FC3);
//掩码
Mat mask;
//inRange函数,在阈值为255(白),不在阈值为0(黑)
inRange(hsv, Scalar(hmin, smin / float(smin_Max), vmin / float(vmin_Max)), Scalar(hmax, smax / float(smax_Max), vmax / float(vmax_Max)), mask);
//只保留
for (int r = 0; r < bgr.rows; r++)
{
for (int c = 0; c < bgr.cols; c++)
{
if (mask.at<uchar>(r, c) == 255)
{
dst.at<Vec3f>(r, c) = bgr.at<Vec3f>(r, c);
}
}
}
//输出图像
imshow(dstName, dst);
//保存图像
dst.convertTo(dst, CV_8UC3, 255.0, 0);
imwrite("HSV_inRange.jpg", dst);
}
int main(int argc, char* argv[])
{
//输入图像
img = imread("E://hashiqi.jpg", IMREAD_COLOR);
if (!img.data || img.channels() != 3)
return -1;
imshow(windowName, img);
//彩色图像的灰度值归一化
img.convertTo(bgr, CV_32FC3, 1.0 / 255, 0);
//颜色空间转换
cvtColor(bgr, hsv, COLOR_BGR2HSV);
//定义输出图像的显示窗口
namedWindow(dstName, WINDOW_GUI_EXPANDED);
//调节色相 H
createTrackbar("hmin", dstName, &hmin, hmin_Max, callBack);
createTrackbar("hmax", dstName, &hmax, hmax_Max, callBack);
//调节饱和度 S
createTrackbar("smin", dstName, &smin, smin_Max, callBack);
createTrackbar("smax", dstName, &smax, smax_Max, callBack);
//调节亮度 V
createTrackbar("vmin", dstName, &vmin, vmin_Max, callBack);
createTrackbar("vmax", dstName, &vmax, vmax_Max, callBack);
callBack(0, 0);
waitKey(0);
return 0;
}
/*
* createTrackbar()函数的函数原型为:
CV_EXPORTS int createTrackbar(const String& trackbarname, const String& winname,int* value, int count,TrackbarCallback onChange = 0, void* userdata = 0);
trackbarname:这个参数用来给这个滚动条取一个名字;
winname:这个参数用来指定你要吧这个滚动条用到那个窗口上;
value:这个参数用来设置滑块初始值位置,同时记录滑块以后的位置;
count:这个参数用来指定滚动条可以滚动的最大值;
onChange:这个参数可以理解为一个函数类型的变量(当然这样说感觉有点怪),用来接收回调函数函数名的,默认值为0;
userdata:这个变量这个参数是用户传给回调函数的数据,用来处理轨迹条事件,默认值为0。
*/