Adaboost应用系列之一：Opencv2.0中利用Adaboost训练Haar特征产生xml分类器

最新推荐文章于 2023-07-03 12:26:15 发布

holybin

最新推荐文章于 2023-07-03 12:26:15 发布

阅读量1w

点赞数

分类专栏：图像处理/计算机视觉文章标签： OpenCV AdaBoost Haar

本文链接：https://blog.csdn.net/holybin/article/details/16840875

版权

图像处理/计算机视觉专栏收录该内容

53 篇文章 3 订阅

订阅专栏

网上很多如题的内容，我结合自己的亲身使用整理归纳了一下，供大家参考：

1.采集样本

（1）正样本就是图片中只有你需要的目标，而负样本的图片只要其中不含有目标就可以了。使用批量截图工具（光影魔术手，美图看看之类的）或者人工截图采集正负样本，但是正样本图片最好是裁剪成同一尺寸或者高宽比大致相同；

（2）其次是训练样本要和最终的应用场合非常接近或者一致。否则，基于机器学习的算法并不能保证算法的有效性。举个例子，要检测的目标是汽车，那么正样本就应该是仅仅含有汽车的图片，而负样本应该尽量是包含摩托车、三轮车、自行车、行人、路面、灌木丛、花草、交通标志、广告牌等的图片；

（3）最后，训练样本要足够多，上千张是最低保证，而且负样本要稍微比正样本多（正负样本比例1:2.5至1:3左右），可以降低false positive。

2.预处理样本

（1）对所有的正样本进行尺寸归一化（可以编程实现或使用批量处理工具），负样本不需要，但是负样本图像尺寸应该比训练窗口（这里是30*30）的尺寸大，因为这些图像将被用于抠取负样本，并将负样本缩小到训练窗口大小。

（2）我这里是统一正样本尺寸等于训练窗口尺寸（30*30），样本尺寸大小会影响到后面的训练速度，建议不要太大。

（3）无论正样本负样本，图片命名时不要用特殊字符，建议简单化用数字名字。将正负样本分别放在两个不同的文件夹下面，分别取名pos和neg，其中pos用来存放正样本图像，neg用来存放负样本。

3.生成正负样本描述文件

（1）正样本描述文件的格式是：文件名目标个数目标在图片中的位置（x,y,width,height）。例如每个正样本图片只包含一个目标，图片尺寸为30*30，则格式如下：

0.bmp 1 0 0 30 30
1.bmp 1 0 0 30 30
2.bmp 1 0 0 30 30

…………

（2）生成正样本描述文件：在cmd下进入pos文件夹目录里，输入 dir /b > pos.txt：

再用notepad++之类的编辑软件打开它，删除最后一行的pos.txt：

再使用查找替换的办法（编程实现当然更高端）将pos.txt的每行转化为（1）所说的描述文件的格式：

最后的结果如下：

（3）生成负样本描述文件：在cmd下进入neg文件夹目录里，输入 dir /b > neg.txt：

再用notepad++之类的编辑软件打开它，删除最后一行的neg.txt即可，不用更改格式：

4.创建正样本vec文件

（1）HaarTraining训练的需要输入的正样本是vec文件，所以这里使用opencv自带的opencv_createsamples程序（opencv安装路径下面的bin文件夹）来将正样本转换为vec文件。如图将程序拷贝到neg和pos同一目录：

（2）在CMD下输入如下命令：
opencv_createsamples.exe -vec pos.vec -info pos\pos.txt -bg neg\neg.txt -w 30 -h 30 -num 1416
以上参数的含义如下：
－vec <vec_file_name>：训练好的正样本的输出文件名。
－img<image_file_name>：源目标图片（例如：一个公司图标）
－bg<background_file_name>：背景描述文件。
－num<number_of_samples>：要产生的正样本的数量，和正样本图片数目相同。
－bgcolor<background_color>：背景色（假定当前图片为灰度图）。背景色制定了透明色。对于压缩图片，颜色方差量由bgthresh参数来指定。则在bgcolor－bgthresh 和bgcolor＋bgthresh 中间的像素被认为是透明的。
－bgthresh<background_color_threshold>

－inv：如果指定，颜色会反色
－randinv：如果指定，颜色会任意反色
－maxidev<max_intensity_deviation>：背景色最大的偏离度。
－maxangel<max_x_rotation_angle>，
－maxangle<max_y_rotation_angle>，
－maxzangle<max_x_rotation_angle>：最大旋转角度，以弧度为单位。
－show：如果指定，每个样本会被显示出来，按下"esc"会关闭这一开关，即不显示样本图片，而创建过程
继续。这是个有用的debug 选项。
－w<sample_width>：输出样本的宽度（以像素为单位）
－h<sample_height>：输出样本的高度（以像素为单位）

（3）执行之后就会在当前目录产生一个pos.vec的文件：

得到的vec文件：，负样本不需要创建vec文件。

5.训练样本

（1）可以使用opencv自带的opencv_haartraining.exe来训练，也可以使用opencv_traincascade.exe进行训练。他们的不同之处在于后者是前者的新版本；而且前者只针对Haar特征，而后者除了训练Haar之外可以训练别的特征，如HOG、LBP等。我这里使用opencv_haartraining.exe为例子。

（2）将程序拷贝至当前目录，并新建一个classifier目录用于存放训练好的分类器：

（3）在CMD下输入如下命令：

opencv_haartraining.exe -data classifier -vec pos.vec -bg neg\neg.txt -w 30 -h 30 -mem 500 -mode all

程序的命令行参数如下：
－data<dir_name>：存放训练好的分类器的路径名（上面的classifier目录）；
－vec<vec_file_name>：正样本文件名（上面得到的pos.vec文件）；
－bg<background_file_name>：背景描述文件（上面得到的neg.txt文件）；
－npos<number_of_positive_samples>，
－nneg<number_of_negative_samples>：用来训练每一个分类器阶段的正/负样本；

－nstages<number_of_stages>：训练的阶段数；
－nsplits<number_of_splits>：决定用于阶段分类器的弱分类器（如果1，则一个简单的stump classifier 被使用。如果是2 或者更多，则带有number_of_splits 个内部节点的CART 分类器被使用）；
－mem<memory_in_MB>：预先计算的以MB 为单位的可用内存。内存越大则训练的速度越快；

－sym（default），

－nonsym：指定训练的目标对象是否垂直对称。垂直对称提高目标的训练速度，例如正面部是垂直对称的；
－minhitrate<min_hit_rate>：每个阶段分类器需要的最小的命中率。总的命中率为min_hit_rate 的number_of_stages 次方；
－maxfalsealarm<max_false_alarm_rate>：没有阶段分类器的最大错误报警率。总的错误警告率为max_false_alarm_rate 的number_of_stages 次方；
－weighttrimming<weight_trimming>：指定是否使用权修正和使用多大的权修正。一个基本的选择是0.9；

－eqw
－mode<basic(default)|core|all>：选择用来训练的haar 特征集的种类。basic 仅仅使用垂直特征。all 使用垂直和45 度角旋转特征；

－w<sample_width>，

－h<sample_height>：训练样本的尺寸（以像素为单位），必须和训练样本创建的尺寸相同。

（4）开始训练，样本数目如果多的话时间挺长的：