opencv学习笔记之彩色目标追踪

今天在学习彩色目标追踪,程序来源是opencv3.3.0版本官方参考源码,我的路径是在C:\Opencv\opencv\sources\samples\cpp里的camshiftdemo.cpp里复制过来的,大家可以轻松找到。没有进行特别大的修改就可以使用,就在最开始加了#include "stdafx.h"的头文件。下面是对源码的一些较详细的注释。

/****************************************************************
*    该函数的功能:彩色目标跟踪
*    来源:opencv3.3.0版本官方例程
*  注意:
*      opencv2.0以后的版本函数命名前没有cv两字了,并且如果函   数名是由2个意思的单词片段组成的话,
*      且前面那个片段不够成单词,则第一个字母要大写,比如Camshift,如果第一个字母是个
*      单词,则小写,比如meanShift,但是第二个字母一定要大写
*
*
*
****************************************************************/
#include "stdafx.h"
#include <opencv2/core/utility.hpp>
#include "opencv2/video/tracking.hpp"
#include "opencv2/imgproc.hpp"
#include "opencv2/videoio.hpp"
#include "opencv2/highgui.hpp"

#include <iostream>
#include <ctype.h>

using namespace cv;
using namespace std;

Mat image;

bool backprojMode = false;//表示是否要进入反向投影模式,ture表示准备进入反向投影模式
bool selectObject = false;//代表是否在选要跟踪的初始目标,true表示正在用鼠标选择
int trackObject = 0;   //代表跟踪目标数目
bool showHist = true; //是否显示直方图
Point origin;  //用于保存鼠标选择第一次单击时点的位置
Rect selection;//用于保存鼠标选择的矩形框
int vmin = 10, vmax = 256, smin = 30;

// User draws box around object to track. This triggers CAMShift to start tracking
//用户在对象周围绘制方框以跟踪。这就触发了CAMShift开始跟踪
static void onMouse(int event, int x, int y, int, void*)
{
	if (selectObject)//只有当鼠标左键按下去时才有效,然后通过if里面代码就可以确定所选择的矩形区域selection了
	{
		selection.x = MIN(x, origin.x);//矩形左上角顶点坐标
		selection.y = MIN(y, origin.y);
		selection.width = std::abs(x - origin.x);//矩形宽
		selection.height = std::abs(y - origin.y);//矩形高

		selection &= Rect(0, 0, image.cols, image.rows);//用于确保所选的矩形区域在图片范围内
	}

	switch (event)
	{
	case EVENT_LBUTTONDOWN:
		origin = Point(x, y);
		selection = Rect(x, y, 0, 0);//鼠标刚按下去时初始化了一个矩形区域
		selectObject = true;
		break;
	case EVENT_LBUTTONUP:
		selectObject = false;
		if (selection.width > 0 && selection.height > 0)
			trackObject = -1;   // 在main()循环中设置CAMShift属性   Set up CAMShift properties in main() loop
		break;
	}
}

string hot_keys =
"\n\nHot keys: \n"      //热键
"\tESC - quit the program\n"  //退出程序
"\tc - stop the tracking\n"     //停止跟踪
"\tb - switch to/from backprojection view\n" //切换到/从投影视图
"\th - show/hide object histogram\n"  //柱状图
"\tp - pause video\n"   //暂停视频
"To initialize tracking, select the object with mouse\n";// 初始化跟踪,用鼠标选择对象

static void help()
{
	cout << "\nThis is a demo that shows mean-shift based tracking\n"  //均值漂移
		"You select a color objects such as your face and it tracks it.\n"//你选择一个颜色对象,比如你的脸,它会追踪它。
		"This reads from video camera (0 by default, or the camera number the user enters\n"//这是从摄像机(默认值0,或用户输入的摄像机号上读取的
		"Usage: \n"
		"   ./camshiftdemo [camera number]\n";
	cout << hot_keys;
}

const char* keys =
{
	"{help h | | show help message}{@camera_number| 0 | camera number}"
};

int main(int argc, const char** argv)
{
	VideoCapture cap;//定义一个摄像头捕捉的类对象
	Rect trackWindow;//跟踪窗口
	int hsize = 16;
	float hranges[] = { 0,180 };//hranges在后面的计算直方图函数中要用到
	const float* phranges = hranges;
	CommandLineParser parser(argc, argv, keys);//命令解析器函数
	if (parser.has("help"))
	{
		help();
		return 0;
	}
	int camNum = parser.get<int>(0);
	cap.open(camNum); //直接调用成员函数打开摄像头

	if (!cap.isOpened())//如果摄像头调用不成功
	{
		help();
		cout << "***Could not initialize capturing...***\n";
		cout << "Current parameter's value: \n";//无法初始化获取. .当前的参数的值
		parser.printMessage();
		return -1;
	}
	cout << hot_keys;
	namedWindow("Histogram", 0);
	namedWindow("CamShift Demo", 0);
	setMouseCallback("CamShift Demo", onMouse, 0);//消息响应机制
	createTrackbar("Vmin", "CamShift Demo", &vmin, 256, 0);//createTrackbar函数的功能是在对应的窗口创建滑动条,滑动条Vmin,vmin表示滑动条的值,最大为256
	createTrackbar("Vmax", "CamShift Demo", &vmax, 256, 0);//最后一个参数为0代表没有调用滑动拖动的响应函数
	createTrackbar("Smin", "CamShift Demo", &smin, 256, 0);//vmin,vmax,smin初始值分别为10,256,30

	Mat frame, hsv, hue, mask, hist, histimg = Mat::zeros(200, 320, CV_8UC3), backproj;
	bool paused = false;

	for (;;)
	{
		if (!paused)//没有暂停
		{
			cap >> frame;//从摄像头抓取一帧图像并输出到frame中
			if (frame.empty())//如果没有读取到图像,则跳出
				break;
		}

		frame.copyTo(image);

		if (!paused)//没有按暂停键
		{
			cvtColor(image, hsv, COLOR_BGR2HSV);//将rgb摄像头帧转化成hsv空间的

			if (trackObject)//trackObject初始化为0, 或者按完键盘的‘c‘键后也为0,当鼠标单击松开后为 - 1
			{
				int _vmin = vmin, _vmax = vmax;
	/***********************************************************************
	inRange函数的功能是检查输入数组每个元素大小是否在2个给定数值之间,可以有
	多通道,mask保存0通道的最小值,也就是h分量。这里利用了hsv的3个通道,
	比较h,0~180,s,smin~256,v,min(vmin,vmax),max(vmin,vmax)。如果3个通道
	都在对应的范围内,则mask对应的那个点的值全为1(0xff),否则为0(0x00).
	**************************************************************************/
				inRange(hsv, Scalar(0, smin, MIN(_vmin, _vmax)),
					Scalar(180, 256, MAX(_vmin, _vmax)), mask);
				int ch[] = { 0, 0 };
				hue.create(hsv.size(), hsv.depth());//hue初始化为与hsv大小深度一样的矩阵,色调的度量是用角度表示的,红绿蓝之间相差120度,反色相差180度
				mixChannels(&hsv, 1, &hue, 1, ch, 1);//将hsv第一个通道(也就是色调)的数复制到hue中,0索引数组

				if (trackObject < 0)//鼠标选择区域松开后,该函数内部又将其赋值1
				{
					// Object has been selected by user, set up CAMShift search properties once
					//对象已经被用户选择了,设置了CAMShift搜索属性
					//此处的构造函数roi用的是Mat hue的矩阵头,且roi的数据指针指向hue,即共用相同的数据,select为其感兴趣的区域
					Mat roi(hue, selection), maskroi(mask, selection);//mask保存的hsv的最小值
				
			        //calcHist()函数第一个参数为输入矩阵序列,
					//第2个参数表示输入的矩阵数目,
					//第3个参数表示将被计算直方图维数通道的列表,
					//第4个参数表示可选的掩码函数
					//第5个参数表示输出直方图,
					//第6个参数表示直方图的维数,
					//第7个参数为每一维直方图数组的大小,
					//第8个参数为每一维直方图bin的边界
					calcHist(&roi, 1, 0, maskroi, hist, 1, &hsize, &phranges);//将roi的0通道计算直方图并通过mask放入hist中,hsize为每一维直方图的大小
					normalize(hist, hist, 0, 255, NORM_MINMAX);//将hist矩阵进行数组范围归一化,都归一化到0~255

					trackWindow = selection;
					trackObject = 1; //只要鼠标选完区域松开后,且没有按键盘清0键‘c‘,则trackObject一直保持为1,因此该if函数只能执行一次,除非重新选择跟踪区域// Don't set up again, unless user selects new ROI

					histimg = Scalar::all(0); //与按下‘c‘键是一样的,这里的all(0)表示的是标量全部清0
					int binW = histimg.cols / hsize;//histing是一个200*300的矩阵,hsize应该是每一个bin的宽度,也就是histing矩阵能分出几个bin出来
					Mat buf(1, hsize, CV_8UC3);//定义一个缓冲单bin矩阵
					for (int i = 0; i < hsize; i++)
						//saturate_case函数为从一个初始类型准确变换到另一个初始类型
						buf.at<Vec3b>(i) = Vec3b(saturate_cast<uchar>(i*180. / hsize), 255, 255);//Vec3b为3个char值的向量
					cvtColor(buf, buf, COLOR_HSV2BGR); //将hsv又转换成bgr

					for (int i = 0; i < hsize; i++)
					{
						int val = saturate_cast<int>(hist.at<float>(i)*histimg.rows / 255);//at函数为返回一个指定数组元素的参考值
						rectangle(histimg, Point(i*binW, histimg.rows), //在一幅输入图像上画一个简单抽的矩形,指定左上角和右下角,并定义颜色,大小,线型等
							Point((i + 1)*binW, histimg.rows - val),
							Scalar(buf.at<Vec3b>(i)), -1, 8);
					}
				}

				// Perform CAMShift 执行
				calcBackProject(&hue, 1, 0, hist, backproj, &phranges);//计算直方图的反向投影,计算hue图像0通道直方图hist的反向投影,并让入backproj中
				backproj &= mask;

				//opencv2.0以后的版本函数命名前没有cv两字了,并且如果函数名是由2个意思的单词片段组成的话,
				//且前面那个片段不够成单词,则第一个字母要大写,比如Camshift,如果第一个字母是个
				//单词,则小写,比如meanShift,但是第二个字母一定要大写

				RotatedRect trackBox = CamShift(backproj, trackWindow,
					TermCriteria(TermCriteria::EPS | TermCriteria::COUNT, 10, 1));//trackWindow为鼠标选择的区域,TermCriteria为确定迭代终止的准则
				if (trackWindow.area() <= 1)
				{
					int cols = backproj.cols, rows = backproj.rows, r = (MIN(cols, rows) + 5) / 6;
					trackWindow = Rect(trackWindow.x - r, trackWindow.y - r,
						trackWindow.x + r, trackWindow.y + r) &
						Rect(0, 0, cols, rows);//Rect函数为矩阵的偏移和大小,即第一二个参数为矩阵的左上角点坐标,第三四个参数为矩阵的宽和高
				}

				if (backprojMode)
					cvtColor(backproj, image, COLOR_GRAY2BGR);//因此投影模式下显示的也是rgb图
				ellipse(image, trackBox, Scalar(0, 0, 255), 3, LINE_AA);//跟踪的时候以椭圆为代表目标
			}
		}
		//后面的代码是不管pause为真还是为假都要执行的
		else if (trackObject < 0) //同时也是在按了暂停字母以后
			paused = false;

		if (selectObject && selection.width > 0 && selection.height > 0)
		{
			Mat roi(image, selection);
			bitwise_not(roi, roi);//bitwise_not为将每一个bit位取反
		}

		imshow("CamShift Demo", image);
		imshow("Histogram", histimg);

		char c = (char)waitKey(10);
		if (c == 27)      //退出键
			break;
		switch (c)
		{
		case 'b':         //反向投影模型交替
			backprojMode = !backprojMode;
			break;
		case 'c':        //清零跟踪目标对象
			trackObject = 0;
			histimg = Scalar::all(0);
			break;
		case 'h':        //显示直方图交替
			showHist = !showHist;
			if (!showHist)
				destroyWindow("Histogram");
			else
				namedWindow("Histogram", 1);
			break;
		case 'p':        //暂停跟踪交替
			paused = !paused;
			break;
		default:
			;
		}
	}

	return 0;
}

一些重要函数解释:
先来看一下鼠标回调函数
(1)onMouse

函数原型:void onMouse( int event, int x, int y, int, void* )。

在这个函数内,必须要设置一些基本的信息。比如鼠标初始位置,终止位置,确定好rect矩形的大小和位置信息。最后等待鼠标按键触发,传递参数x和y为鼠标点击的位置 坐标。

用switch确定event有好几种鼠标触发方式。还要设置按键开关。这里是selectObject,一般是按下的时候为true,松开的时候为false。最好在每次按键触发的时候加入if条件,判断rect是否真的被触发或者触发的位置是否符合要求。

(2)createTrackbar滑动条

CV_EXPORTS int createTrackbar( const string& trackbarname, const string& winname,
int* value, int count,
TrackbarCallback onChange=0,
void* userdata=0);
前两个参数分别指定了滑动条的名字以及滑动条附属窗口的名字。当滑动条被创建后,滑动条会被创建在窗口的顶部或者底部。另外,滑动条不会遮挡窗口中的图像。
随后的两个为value,它是一个整数指针,当滑动条被拖动时,opencv会自动将当前位置所代表的值创递给指针指向的整数;另外一个参数count是一个整数数值,为滑动条所能表示的最大值。
最后一个参数是一个指向回调函数的指针,当滑动条被拖动时,回调函数会自动被调用。这跟鼠标事件的回调函数实现类似。回调函数必须为CvTrackbarCallback格式,定义如下:

void (*callback)(int position)

这个回调函数不是必须的,所以如果不需要一个回调函数,可以将参数设置为NULL,没有回调函数,当滑动条被拖动时,唯一的影响就是改变指针value所指向的整数值。
highgui还提供了两个函数分别用来读取与设置滑动条的value值,不过前提是必须知道滑动条的名字。

int cvGetTrackbarPos(const char* trackbar_name,const char * window_name);

void cvSetTrackbarPos(const char* trackbar_name, const char * window_name,int pos);

(3)InRange

检查数组元素是否在两个数组之间
void cvInRange( const CvArr* src, const CvArr* lower, const CvArr* upper, CvArr* dst );
src
第一个原数组
lower
包括进的下边界数组
upper
不包括进的上边界线数组
dst
输出数组必须是 8u 或 8s 类型.
函数 cvInRange 对输入的数组作范围检查,对于单通道数组:
dst(I)=lower(I)0 <= src(I)0 < upper(I)0
对二通道数组:
dst(I)=lower(I)0 <= src(I)0 < upper(I)0 &&
lower(I)1 <= src(I)1 < upper(I)1
以此类推
如果 src(I) 在范围内dst(I)被设置为 0xff (每一位都是 ‘1’)否则置0 。 除了输出数组所有数组必须是相同的类型相同的大小(或ROI大小)。

(4)calcHist函数来计算图像直方图。
其中C++的函数原型如下:

void calcHist(const Mat* arrays, int narrays, const int* channels, InputArray mask,

OutputArray hist, int dims, const int* histSize, const float** ranges,

bool uniform=true, bool accumulate=false );

参数解释:
arrays。输入的图像的指针,可以是多幅图像,所有的图像必须有同样的深度(CV_8U or CV_32F)。同时一副图像可以有多个channes。
narrays。输入的图像的个数。
channels。用来计算直方图的channes的数组。比如输入是2副图像,第一副图像有0,1,2共三个channel,第二幅图像只有0一个channel,那么输入就一共有4个channes,如果int channels[3] = {3, 2, 0},那么就表示是使用第二副图像的第一个通道和第一副图像的第2和第0个通道来计算直方图。
mask。掩码。如果mask不为空,那么它必须是一个8位(CV_8U)的数组,并且它的大小的和arrays[i]的大小相同,值为1的点将用来计算直方图。
hist。计算出来的直方图
dims。计算出来的直方图的维数。
histSize。在每一维上直方图的个数。简单把直方图看作一个一个的竖条的话,就是每一维上竖条的个数。
ranges。用来进行统计的范围。比如
float rang1[] = {0, 20};
float rang2[] = {30, 40};
const float *rangs[] = {rang1, rang2};那么就是对0,20和30,40范围的值进行统计。
uniform。每一个竖条的宽度是否相等。
accumulate。Accumulation flag. If it is set, the histogram is not cleared in the beginning
when it is allocated. This feature enables you to compute a single histogram from several
sets of arrays, or to update the histogram in time. 是否累加。如果为true,在下次计算的时候不会首先清空hist。

最后:我摄像头用的电脑自带的前置摄像头,画质比较渣,哈哈。我在运行的时候显示用debug来运行,结果鼠标不能对彩色目标进行选择,dos窗口命令也不能正常使用,然后我将debug换成Release,运行成功了。

这里写图片描述

这里写图片描述

彩色目标跟踪可能会受到光线、摄像头像素的影响,有时候会追踪失败,还需要再去诱引。

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

翟羽嚄

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值