OpenCV - 训练分类器

最新推荐文章于 2024-05-16 14:07:07 发布

南泉先生

最新推荐文章于 2024-05-16 14:07:07 发布

阅读量476

点赞数

分类专栏： openCV 文章标签： OpenCV 机器学习分类器训练

openCV 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一．收集样本

正样本：待检目标样本

负样本：其它任意图片

PS.所有样本图片都应该有同一尺寸，如20 * 20

ACDSee软件：对图像批量处理为20x20大小的图片

1.把所有正样本图片放在posdata的文件夹下，把所有负样本图片放在negdata文件夹下

负样本数量应大于正样本数量，如(3:1)，否则在训练时会陷入死循环。。。

1.分别为正样本和负样本创建描述文件

(1)为正样本创建描述文件格式文件info.txt，并且把这个文件放在与样本图片同一目录下,D:\OpenCv\opencv\build\x64\

vc12\bin\posdata

a)在命令行下输入以下命令： dir/b > info.txt

b)删除info.txt最后一行的 “info.txt”

c)打开info.txt, 按ctrl+h, 把所有的”bmp” 换成

“bmp 1 0 0 20 20”

1代表一个文件 ||0 0顶点坐标 || 20 20右下顶点坐标

(2)为负样本创建集合文件格式文件bg.txt, 并且把这个文件放在与样本图片同一目录下

a)在命令行下输入以下命令： dir /b > bg.txt

b)删除bg.txt最后一行的 “bg.txt”

二．创建样本

Ps: createsamples程序的命令行参数

info<file>	正样本描述文件
vec <vec_file_name>	训练好的正样本的输出文件名
num<number_of_samples>	要产生的正样本的数量，和正样本图片数目相同
－w －h	样本的宽高

执行脚本后，将生成正样本描述文件a.vec

————————————————————-

其他的一些参数：

－img<image_file_name>

源目标图片（例如：一个公司图标）

－bg<background_file_name>

背景描述文件。

–maxidev<max_intensity_deviation>

背景色最大的偏离度。

－maxangel<max_x_rotation_angle>

－maxangle<max_y_rotation_angle>，

－maxzangle<max_x_rotation_angle>

最大旋转角度，以弧度为单位。

－show

如果指定，每个样本会被显示出来，按下“esc”会关闭这一开关，即不显示样本图片，而创建过程继续。这是个有用的debug选项。

结果：

二．训练级联分类器

Ps: Haartraining的命令行参数如下

data<dir_name>	存放训练好的分类器的路径名
vec<vec_file_name>	正样本文件名（由trainingssamples程序或者由其他的方法创建的）绝对路径
bg<background_file_name>	背景描述文件。绝对路径
npos<number_of_positive_samples>	用来训练每一个分类器阶段的正样本数量Ps:正样本的数目(-npos)要略大于实际数
nneg<number_of_negative_samples>	用来训练每一个分类器阶段的负样本数量
nstages<number_of_stages>	训练的阶段(层)数
nsplits<number_of_splits>	决定用于阶段分类器的弱分类器。如果值为1，则一个简单的stump classifier被使用。如果是2或者更多，则带有number_of_splits个内部节点的CART分类器被使用
mem<memory_in_MB>	预先计算的以MB为单位的可用内存。内存越大则训练的速度越快
nonsym	指定训练的目标对象是否垂直对称。垂直对称提高目标的训练速度。例如，正面部是垂直对称的
mode all	表示使用haar特征集的各类既有垂直的，又有45度角旋转的
－w<sample_width> －h<sample_height>	训练样本的尺寸，（以像素为单位）。必须和训练样本创建的尺寸相同

其他的一些参数：
－sym（default）
－minhitrate<min_hit_rate>
    每个阶段分类器需要的最小的命中率。总的命中率为min_hit_rate的number_of_stages次方。
－maxfalsealarm<max_false_alarm_rate>
    没有阶段分类器的最大错误报警率。总的错误警告率为   max_false_alarm_rate的number_of_stages次方。每一层训练到这  个值小于0.5时训练结束，进入下一层训练
－weighttrimming<weight_trimming>
    指定是否使用权修正和使用多大的权修正。一个基本的选择是0.9
－eqw
－mode<basic(default)|core|all>
    选择用来训练的haar特征集的种类。basic仅仅使用垂直特征。all使用垂直和45度角旋转特征。

Ø 参数的配置十分重要，很多时候训练不成功多是因为参数的配置问题！！！

———————————————————–

训练过程参数值解释：

N：层数 %

SMP：样本的使用率

F : +表示通过翻转，否则是-

ST.THR : 分类器的阈值

HR：当前分类器对正样本识别正确的概率

FA：当前分类器对负样本识别错误的概率

EXP.ERR : 分类器的期望错误率

———————————————————–

结果：

四．测试

测试代码：人脸识别

因样本数量仅为 5 所以无精度可言

五．错误分析

1.死循环

原因：

负样本数太少，该阶段已无可提取负样本

解决方法：

正 : 负 = 1 : 2.5~3

2.停止工作

报错信息：

参数配置：

原因：

在第一层训练的时候已经用完了vec文件中所有的正样本，以至于在后续的样本训练中没有新的正样本可以加入使用了，导致出现了错误的现象。

那个vec文件中的正样本数目

= npos +（nstages - 1）*（1 - minHitRate）* npos + s

S的意思是指在正样本中能够直接识别成背景的样本个数，如果npos=120的话，s的取值为个位数就行，不用太大。

解决方法：

在训练时，-npos参数值取正样本数的 1/3

如实际正样本数为 300 参数取值则设为 100

源码与文档资料

http://download.csdn.net/download/sgamble/9660734

参考资料

南泉先生

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
OpenCV - 训练分类器

一．收集样本正样本：待检目标样本负样本：其它任意图片PS.所有样本图片都应该有同一尺寸，如20 * 20ACDSee软件：对图像批量处理为20x20大小的图片1.把所有正样本图片放在posdata的文件夹下，把所有负样本图片放在negdata文件夹下负样本数量应大于正样本数量，如(...
复制链接

扫一扫