HOG+ADABOOST方式训练头肩检测模型

最新推荐文章于 2023-03-01 10:36:30 发布

锦绣未央

最新推荐文章于 2023-03-01 10:36:30 发布

阅读量3.3k

点赞数 2

分类专栏：深度学习

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HOG+ADABOOST训练方式网上资料很多，这篇文章是在小编训练过程中遇到的一些问题加以总结。

首先，在准备文件之前先让大家对训练文件有个直观的感受。

训练的文件夹中包含的文件

正样本

负样本

pos.txt

neg.txt

建立一个新文件夹，可以取名为Pedestrian，在Pedestrian文件夹下再建立pos和neg文件夹，用于存放正负样本，xml文件夹用于训练后生成的模型的存放位置，从opencv安装位置（“D:\Environment\opencv\build\x64\vc12\bin”）中拷贝opencv_createsamples.exe 和 opencv_traincascade.exe两个执行文件到Pedestrian文件夹下,pos.txt和neg.txt是正负样本存放位置，以及正样本的标签和位置。以上就是训练时所需要的所有文件，简单吧！但是，在小编训练途中还是碰到很多坑，可能小编太弱了… （羞愧脸）

1. 准备正负样本集pos和neg

这个是最耗时的一项任务啦（悄悄告诉你，小编也是偷了点懒）。

首先是在有行人的视频中抽帧，隔3帧抽一次。当然，做正样本的时候，正常的操作就是手动截图，或者用一些小工具简化这一过程。但是，这里小编用了一个别人训练好的模型，直接把所有从抽到的帧中检测到的头肩保存下来，这样真的省掉很多时间，但是由于这种方式准确率并非百分之百，还是要手动剔除掉不是头肩的部分。小编大概找到头肩样本3000张，然后用opencv或者其他方式将所有样本resize到36x36。所有正样本存放到Pedestrian/pos下，正样本集就完成了。

正负样本的比例一般是1:4~1:5，所以，3000的正样本需要截12000~15000张负样本。

负样本就是不包括头肩的，但是尺寸要大于36x36的图片。负样本最好是可能有行人的背景，这样让模型效果更好。

小编这里也偷个懒，用opencv写了个代码，就是找一张同样场景但是没有行人的图片，然后取宽高100x200,100x100,300x200等多种尺寸，步长为20,30,40,50，遍历并保存图片，这样，多找几张背景图片，很快负样本就完成了，当然，头肩模型，小编在负样本中也加入了一些手臂，腿等非头肩部分作为负样本。

最后，将所有负样本放到Pedestrian/neg文件夹下，负样本集就完成了。这里小编要说一下，正负样本最好命名时分别以pos/neg为开头，这样可以简化后面的操作。

2. 正负样本描述文件pos.txt和neg.txt

打开cmd，输入代码如下：

生成pos.txt和neg.txt

这样，在pos和neg文件夹下就分别生成了pos.txt和neg.txt两个文件，把这两个文件都剪切到Pedestrian文件下，并修改内容如下：

i. 去掉pos.txt文件里的pos.txt那一行，并且删除最后一个空白行，然后，按编辑->替换，编辑如下，然后按全部替换。

替换jpg部分

再替换如下：

替换pos部分

这个是正样本存放路径。pos.txt至此完成。

ii. 去掉neg.txt文件里的neg.txt那一行，并且删除最后一个空白行，然后，按编辑->替换，编辑如下，然后按全部替换。

替换neg部分

这个是负样本存放路径。neg.txt至此完成。

3. 生成pos.vec文件

生成pos.vec文件是利用Pedestrian下的opencv_createsamples.exe执行。打开cmd，进入到Pedestrian文件夹下，输入： opencv_createsamples.exe -info pos.txt -vec pos.vec -bg neg.txt -num 3000 -w 36 -h 36

各个参数的意义，网上都有很多资料对其解释，这里我不做过多介绍。

4. 训练分类器

完成以上工作，就可以开始训练了。

在cmd中，进入Pedestrian目录下，输入：opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 1500 -numNeg 5000 -featureType HOG -w 36 -h 36 mode -ALL

训练开始，如下图：