HOG+ADABOOST方式训练头肩检测模型

HOG+ADABOOST训练方式网上资料很多,这篇文章是在小编训练过程中遇到的一些问题加以总结。

首先,在准备文件之前先让大家对训练文件有个直观的感受。


训练的文件夹中包含的文件



正样本



负样本



pos.txt



neg.txt

建立一个新文件夹,可以取名为Pedestrian,在Pedestrian文件夹下再建立pos和neg文件夹,用于存放正负样本,xml文件夹用于训练后生成的模型的存放位置,从opencv安装位置(“D:\Environment\opencv\build\x64\vc12\bin”)中拷贝opencv_createsamples.exe 和 opencv_traincascade.exe两个执行文件到Pedestrian文件夹下,pos.txt和neg.txt是正负样本存放位置,以及正样本的标签和位置。以上就是训练时所需要的所有文件,简单吧!但是,在小编训练途中还是碰到很多坑,可能小编太弱了… (羞愧脸)

1. 准备正负样本集pos和neg

这个是最耗时的一项任务啦(悄悄告诉你,小编也是偷了点懒)。

首先是在有行人的视频中抽帧,隔3帧抽一次。当然,做正样本的时候,正常的操作就是手动截图,或者用一些小工具简化这一过程。但是,这里小编用了一个别人训练好的模型,直接把所有从抽到的帧中检测到的头肩保存下来,这样真的省掉很多时间,但是由于这种方式准确率并非百分之百,还是要手动剔除掉不是头肩的部分。小编大概找到头肩样本3000张,然后用opencv或者其他方式将所有样本resize到36x36。所有正样本存放到Pedestrian/pos下,正样本集就完成了。

正负样本的比例一般是1:4~1:5,所以,3000的正样本需要截12000~15000张负样本。

负样本就是不包括头肩的,但是尺寸要大于36x36的图片。负样本最好是可能有行人的背景,这样让模型效果更好。

小编这里也偷个懒,用opencv写了个代码,就是找一张同样场景但是没有行人的图片,然后取宽高100x200,100x100,300x200等多种尺寸,步长为20,30,40,50,遍历并保存图片,这样,多找几张背景图片,很快负样本就完成了,当然,头肩模型,小编在负样本中也加入了一些手臂,腿等非头肩部分作为负样本。

最后,将所有负样本放到Pedestrian/neg文件夹下,负样本集就完成了。这里小编要说一下,正负样本最好命名时分别以pos/neg为开头,这样可以简化后面的操作。

2. 正负样本描述文件pos.txt和neg.txt

打开cmd,输入代码如下:



生成pos.txt和neg.txt

这样,在pos和neg文件夹下就分别生成了pos.txt和neg.txt两个文件,把这两个文件都剪切到Pedestrian文件下,并修改内容如下:

i. 去掉pos.txt文件里的pos.txt那一行,并且删除最后一个空白行,然后,按编辑->替换,编辑如下,然后按全部替换。



替换jpg部分

再替换如下:



替换pos部分

这个是正样本存放路径。pos.txt至此完成。

ii. 去掉neg.txt文件里的neg.txt那一行,并且删除最后一个空白行,然后,按编辑->替换,编辑如下,然后按全部替换。



替换neg部分

这个是负样本存放路径。neg.txt至此完成。

3. 生成pos.vec文件

生成pos.vec文件是利用Pedestrian下的opencv_createsamples.exe执行。打开cmd,进入到Pedestrian文件夹下,输入: opencv_createsamples.exe -info pos.txt -vec pos.vec -bg neg.txt -num 3000 -w 36 -h 36

各个参数的意义,网上都有很多资料对其解释,这里我不做过多介绍。

4. 训练分类器

完成以上工作,就可以开始训练了。

在cmd中,进入Pedestrian目录下,输入:opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 1500 -numNeg 5000 -featureType HOG -w 36 -h 36 mode -ALL

训练开始,如下图:



训练时的样子

有几点要注意:

1. numPos的值要低于pos的值;

2. 样本的路径一定要写对;


展开阅读全文

没有更多推荐了,返回首页