opencv 分类器的训练(生成.xml, CascadeClassifier)

检测的物体是否为绝对刚性的物体,也就是检测的目标是一个固定物体,没有变化(如特定公司的商标),这样的物体只要提供一份样本就可以进行训练。但绝大数时候我们想进行训练的目标是非绝对刚性的物体,如对人的检测,包括人脸识别、手势识别。

分类器的训练以分为以下三部进行:

1、 样本的创建(正样本和负样本)
2、 训练分类器(生成.xml)
3、 利用训练好的分类器进行目标检测

正样本:所谓正样本就是只包含检测目标的图片

               1、要求尺寸必须相同,例如40x30

               2、进行灰度处理

负样本:不包含检测目标的任何图片(背景图片)               

             1.不要求样本尺寸,但要大于等于正样本的大小;且负样本不能重复,要增大负样本的差异性。

              2.负样本灰度化,同正样本操作相同。

制作正样本:

           1、收集数据(截图或拍照等)进行处理:

            2、 将所有图像调整成一致大小,我用的“美图看看”这款软件,批量处理的,我处理的统一尺寸是40x30

           3、进行灰度处理

#include "stdafx.h"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/imgproc.hpp"
#include <iostream>
#include <stdio.h>

using namespace cv;
using namespace std;


int main()
{
	char buffer[50];
	char buffer1[50];

	int i = 0;

	for (i = 1; i <= 100; i++)
	{
		sprintf_s(buffer, "C:\\Users\\Administrator\\Desktop\\xml\\ww\\%d.png", i);
		sprintf_s(buffer1, "C:\\Users\\Administrator\\Desktop\\xml\\pos\\%d.png", i);

		Mat src = imread(buffer, IMREAD_COLOR);

		if (src.empty())
		{
			return -1;
		}

		cvtColor(src, src, COLOR_BGR2GRAY);
		equalizeHist(src, src);

		imwrite(buffer1, src);
	}
    return 0;
}

4、这样正样本就处理好了,接下来要生成posdata.dat文件

将opencv安装目录的D:\Program Files\opencv\build\x64\vc15\bin\opencv_createsamples.exe和opencv_traincascade.exe复制到需要进行图像处理的目录下(也可不复制,操作时加上目录)

制作dos命令操作文件dat_cmd.bat:输入dir /b > posdata.dat(表示将当前文件写入posdata.dat)

双击执行dat_cmd.bat生成posdata.dat,打开posdata.dat,删除不需要文件

在对文件进行处理,使其含有图片信息,格式为:图片路径     检测目标在图片中的个数     起始监测点坐标(x,y)        图片大小(w,h)

5、生成训练.vec文件

执行生成pos.vec

参数说明

命令行参数:

  • -vec <vec_file_name>

    输出文件,内含用于训练的正样本。

  • -img <image_file_name>

    输入图像文件名(例如一个公司的标志)。

  • -bg <background_file_name>

    背景图像的描述文件,文件中包含一系列的图像文件名,这些图像将被随机选作物体的背景。

  • -num <number_of_samples>

    生成的正样本的数目。

  • -bgcolor <background_color>

    背景颜色(目前为灰度图);背景颜色表示透明颜色。因为图像压缩可造成颜色偏差,颜色的容差可以由 -bgthresh 指定。所有处于 bgcolor-bgthresh 和 bgcolor+bgthresh 之间的像素都被设置为透明像素。

  • -bgthresh <background_color_threshold>

  • -inv

    如果指定该标志,前景图像的颜色将翻转。

  • -randinv

    如果指定该标志,颜色将随机地翻转。

  • -maxidev <max_intensity_deviation>

    前景样本里像素的亮度梯度的最大值。

  • -maxxangle <max_x_rotation_angle>

    X轴最大旋转角度,必须以弧度为单位。

  • -maxyangle <max_y_rotation_angle>

    Y轴最大旋转角度,必须以弧度为单位。

  • -maxzangle <max_z_rotation_angle>

    Z轴最大旋转角度,必须以弧度为单位。

  • -show

    很有用的调试选项。如果指定该选项,每个样本都将被显示。如果按下 Esc 键,程序将继续创建样本但不再显示。

  • -w <sample_width>

    输出样本的宽度(以像素为单位)。

  • -h <sample_height>

    输出样本的高度(以像素为单位)。

6、处理负样本:对负样本只需得到.dat文件(同正样本处理)

二、训练级联分类器

1、将生成的的负样本negdata.dat复制到和opencv_traincascade.exe同目录下(也可以吧正样本的pos.vec复制到此目录下)

并且制作训练命令train.bat

opencv_traincascade.exe -data cascade -vec pos.vec -bg negdata.dat -numPos 41 -numNeg 100 -numStages 20 -minHitRate 0.999 -maxFalseAlarmRate 0.4 -featureType HAAR -w 40 -h 20

注:pause是为了查看cmd执行

参数说明:

  1. 通用参数:

    • -data <cascade_dir_name>

      目录名,如不存在训练程序会创建它,用于存放训练好的分类器。

    • -vec <vec_file_name>

      包含正样本的vec文件名(由 opencv_createsamples 程序生成)。

    • -bg <background_file_name>

      背景描述文件,也就是包含负样本文件名的那个描述文件。

    • -numPos <number_of_positive_samples>

      每级分类器训练时所用的正样本数目。

    • -numNeg <number_of_negative_samples>

      每级分类器训练时所用的负样本数目,可以大于 -bg 指定的图片数目。

    • -numStages <number_of_stages>

      训练的分类器的级数。

    • -precalcValBufSize <precalculated_vals_buffer_size_in_Mb>

      缓存大小,用于存储预先计算的特征值(feature values),单位为MB。

    • -precalcIdxBufSize <precalculated_idxs_buffer_size_in_Mb>

      缓存大小,用于存储预先计算的特征索引(feature indices),单位为MB。内存越大,训练时间越短。

    • -baseFormatSave

      这个参数仅在使用Haar特征时有效。如果指定这个参数,那么级联分类器将以老的格式存储。

  2. 级联参数:

    • -stageType <BOOST(default)>

      级别(stage)参数。目前只支持将BOOST分类器作为级别的类型。

    • -featureType<{HAAR(default), LBP}>

      特征的类型: HAAR - 类Haar特征; LBP - 局部纹理模式特征。

    • -w <sampleWidth>

    • -h <sampleHeight>

      训练样本的尺寸(单位为像素)。必须跟训练样本创建(使用 opencv_createsamples 程序创建)时的尺寸保持一致。

  3. Boosted分类器参数:

    • -bt <{DAB, RAB, LB, GAB(default)}>

      Boosted分类器的类型: DAB - Discrete AdaBoost, RAB - Real AdaBoost, LB - LogitBoost, GAB - Gentle AdaBoost。

    • -minHitRate <min_hit_rate>

      分类器的每一级希望得到的最小检测率。总的检测率大约为 min_hit_rate^number_of_stages。

    • -maxFalseAlarmRate <max_false_alarm_rate>

      分类器的每一级希望得到的最大误检率。总的误检率大约为 max_false_alarm_rate^number_of_stages.

    • -weightTrimRate <weight_trim_rate>

      Specifies whether trimming should be used and its weight. 一个还不错的数值是0.95。

    • -maxDepth <max_depth_of_weak_tree>

      弱分类器树最大的深度。一个还不错的数值是1,是二叉树(stumps)。

    • -maxWeakCount <max_weak_tree_count>

      每一级中的弱分类器的最大数目。The boosted classifier (stage) will have so many weak trees (<=maxWeakCount), as needed to achieve the given -maxFalseAlarmRate.

  4. 类Haar特征参数:

    • -mode <BASIC (default) | CORE | ALL>

      选择训练过程中使用的Haar特征的类型。 BASIC 只使用右上特征, ALL 使用所有右上特征和45度旋转特征。更多细节请参考 [Rainer2002] 。

  5. LBP特征参数:

    LBP特征无参数。

当 opencv_traincascade 程序训练结束以后,训练好的级联分类器将存储于文件cascade.xml中,这个文件位于 -data 指定的目录中。这个目录中的其他文件是训练的中间结果,当训练程序被中断后,再重新运行训练程序将读入之前的训练结果,而不需从头重新训练。训练结束后,你可以删除这些中间文件。

训练结束后,你就可以测试你训练好的级联分类器了!

三、训练器的测试

参考CascadeClassifier级联分类器的使用https://blog.csdn.net/WangHuiShou/article/details/81201698

四、考 训练分类器所遇到的问题

1、

-bg 参数不能直接跟目录,因为neg目录下手下读取的不是negdata.dat文件,导致失败

2、问题:traincascade's error (Required leaf false alarm rate achieved. Branch training terminated.)

解析:虚警率已经达标 不再继续训练 ,这里不能说是一个错误,只能说制作出来的xml文件可能较差

解决办法:先测试一下生成的cascade.xml,如果效果没有达到你的预期,有以下几个解决方案:
1:maxfalsealarm值应该设定到0.4 - 0.5之间
2:正负样本数太少,增大样本数

四、参考网站

http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html#id6

  • 6
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要使用OpenCV生成分类器,您需要执行以下步骤: 1. 收集一些正面和负面的样本图像,并将它们分别放入两个文件夹中。正面图像应该是您想要检测的对象的图像,而负面图像应该是不包含对象的图像。 2. 安装OpenCV并打开一个命令行界面。 3. 运行以下命令以生成正面图像的列表文件: `opencv_createsamples -img positive_image.png -bg negative_image.txt -info positive_info.lst -pngoutput` 这将使用positive_image.png作为正面图像,negative_image.txt作为负面图像列表,并将生成一个包含正面图像信息的positive_info.lst文件。 4. 运行以下命令以生成分类器: `opencv_traincascade -data classifier -vec positive_info.vec -bg negative_image.txt -numPos 50 -numNeg 100 -numStages 10 -w 20 -h 20` 这将使用positive_info.vec作为正面图像信息,negative_image.txt作为负面图像列表,并将生成一个名为classifier分类器。您可以根据需要调整其他参数,例如numPos和numNeg表示正面和负面样本的数量,numStages表示分类器训练阶段数,w和h表示正面样本的宽度和高度。 5. 在训练过程完成后,您可以使用以下代码加载分类器并在图像中检测对象: ```python import cv2 cascade = cv2.CascadeClassifier('classifier.xml') img = cv2.imread('test_image.png') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) objects = cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30)) for (x, y, w, h) in objects: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) cv2.imshow('Objects', img) cv2.waitKey(0) ``` 这将加载名为classifier.xml分类器,并在test_image.png图像中检测对象。检测出的对象将用绿色矩形框出。您可以根据需要调整scaleFactor、minNeighbors和minSize等参数来优化检测结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值