OpenCV - 训练分类器

一.收集样本

正样本:待检目标样本

负样本:其它任意图片

PS.所有样本图片都应该有同一尺寸,如20 * 20

ACDSee软件:对图像批量处理为20x20大小的图片

1.把所有正样本图片放在posdata的文件夹下,把所有负样本图片放在negdata文件夹下


负样本数量应大于正样本数量,如(3:1),否则在训练时会陷入死循环。。。

1.分别为正样本和负样本创建描述文件

(1)为正样本创建描述文件格式文件info.txt,并且把这个文件放在与样本图片同一目录下,D:\OpenCv\opencv\build\x64\

vc12\bin\posdata

a)在命令行下 输入以下命令: dir/b > info.txt

b)删除info.txt最后一行的 “info.txt”

c)打开info.txt, 按ctrl+h, 把所有的”bmp” 换成

“bmp 1 0 0 20 20”

1代表一个文件   ||0 0顶点坐标 || 20 20右下顶点坐标        


 (2)为负样本创建集合文件格式文件bg.txt, 并且把这个文件放在与样本图片同一目录下

a)在命令行下 输入以下命令: dir /b > bg.txt

b)删除bg.txt最后一行的 “bg.txt”

二.创建样本


Ps: createsamples程序的命令行参数

info<file>

正样本描述文件

vec <vec_file_name>

训练好的正样本的输出文件名

num<number_of_samples>

要产生的正样本的数量,和正样本图片数目相同

-w -h

样本的宽高

执行脚本后,将生成正样本描述文件a.vec

————————————————————-

其他的一些参数:

-img<image_file_name>

源目标图片(例如:一个公司图标)

-bg<background_file_name>

背景描述文件。

–maxidev<max_intensity_deviation>

背景色最大的偏离度。

-maxangel<max_x_rotation_angle>

-maxangle<max_y_rotation_angle>,

-maxzangle<max_x_rotation_angle>

最大旋转角度,以弧度为单位。

-show

如果指定,每个样本会被显示出来,按下“esc”会关闭这一开关,即不显示样本图片,而创建过程继续。这是个有用的debug选项。

结果:


二.训练级联分类器



Ps: Haartraining的命令行参数如下

data<dir_name>

存放训练好的分类器的路径名

vec<vec_file_name>

正样本文件名(由trainingssamples程序或者由其他的方法创建的)绝对路径

bg<background_file_name>

背景描述文件。绝对路径

npos<number_of_positive_samples>

用来训练每一个分类器阶段的正样本数量Ps:正样本的数目(-npos)要略大于实际数

nneg<number_of_negative_samples>

用来训练每一个分类器阶段的负样本数量

nstages<number_of_stages>

训练的阶段(层)数

 

 

nsplits<number_of_splits>

决定用于阶段分类器的弱分类器。如果值为1,则一个简单的stump classifier被使用。如果是2或者更多,则带有number_of_splits个内部节点的CART分类器被使用

mem<memory_in_MB>

预先计算的以MB为单位的可用内存。内存越大则训练的速度越快

 

nonsym

指定训练的目标对象是否垂直对称。垂直对称提高目标的训练速度。例如,正面部是垂直对称的

mode all

表示使用haar特征集的各类既有垂直的,又有45度角旋转的

-w<sample_width>
-h<sample_height>

训练样本的尺寸,(以像素为单位)。必须和训练样本创建的尺寸相同

其他的一些参数:
-sym(default)
-minhitrate<min_hit_rate>
    每个阶段分类器需要的最小的命中率。总的命中率为min_hit_rate的number_of_stages次方。
-maxfalsealarm<max_false_alarm_rate>
    没有阶段分类器的最大错误报警率。总的错误警告率为   max_false_alarm_rate的number_of_stages次方。每一层训练到这  个值小于0.5时训练结束,进入下一层训练
-weighttrimming<weight_trimming>
    指定是否使用权修正和使用多大的权修正。一个基本的选择是0.9
-eqw
-mode<basic(default)|core|all>
    选择用来训练的haar特征集的种类。basic仅仅使用垂直特征。all使用垂直和45度角旋转特征。

Ø  参数的配置十分重要,很多时候训练不成功多是因为参数的配置问题!!!

———————————————————–

训练过程参数值解释:


N:层数  %

SMP:样本的使用率 

F : +表示通过翻转,否则是-

ST.THR : 分类器的阈值 

HR:当前分类器 对正样本识别正确的概率

FA:当前分类器 对负样本识别错误的概率

EXP.ERR : 分类器的期望错误率

———————————————————–

结果:

四.测试

测试代码:人脸识别

因样本数量仅为 5 所以无精度可言

五.错误分析

1.死循环


原因:

负样本数太少,该阶段已无可提取负样本

解决方法:

正 : 负 = 1 : 2.5~3

2.停止工作

报错信息:

参数配置

原因:

在第一层训练的时候已经用完了vec文件中所有的正样本,以至于在后续的样本训练中没有新的正样本可以加入使用了,导致出现了错误的现象。

那个vec文件中的正样本数目

   = npos +(nstages - 1)*(1 - minHitRate)* npos + s

S的意思是指在正样本中能够直接识别成背景的样本个数,如果npos=120的话,s的取值为个位数就行,不用太大。

解决方法:

在训练时,-npos参数值取 正样本数的 1/3

如 实际正样本数为 300 参数取值则设为 100

 

源码与文档资料

http://download.csdn.net/download/sgamble/9660734

参考资料

OpenCV 训练分类器生成XML文件

训练分类器

训练参数设置

英语-训练分类器,参数设置,人脸检测




  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值