这几天废了九牛二虎之力,训练出了一个分类器。分享一下方法
第一步,也是最重要的一步,就是采集样品,样品的采集直接影响到以后的结果。这里要注意的是,正样品的大小必须相同(采集的时候可以不同,采集完成后可以使用工具修改,但是比例一定要相同,不然修改以后也会不同),等下给出采集样品用到的工具,负样品的尺寸大小一般要比正样品的大一些。数量的比例大概为正样品:负样品=1:3最好。
还有要注意的就是负样品中不能包含正样品。另外,数目要多一点,负样本尽量
为背景图片,不然最后训练的虽然快,但是,没什么效果。
第二步,生成一个描述文件,先说负样品,描述文件的内容为全部样品的名称,建立保存负样本的文件夹(如:neg),并在neg目录下建立negdata.dat描述文件
Negdata.dat的内容如下:
1.bmp
2.bmp
3.bmp
…
可以利用工具先全部改下名字,方便查看,然后进入命令行程序--cmd.exe,进入到相应的文件夹,我的是cd C:\Users\zqj\Desktop\classfier\neg,然后dir /b >negdata.dat,就会生成一个相应的文件,不过要记得去掉最后一行呦。
正样品稍微麻烦一点,建立保存正样本的文件夹(如:pos),并在pos目录下建立posdata.dat描述文件,到这里与负样本的准备是一致的。不同之处在于正样本的描述中需