特征的设计在此不做解释,随着研究的深入,很多学者丰富和改善了以前的那些特征,最原始的矩形特征为例:
所谓的弱分类器其实是由特征f、阈值theta和一个决定不等号方向的p所决定的在此先不考虑p,简单谈谈我理解中的选择最优弱分类器的过程。
在上述的特征中,第一中的特征值就是两个矩形的像素值之差,那么对于很多个训练样本,比如说现在有200幅正例图像,1000幅负例图像,那么在这些图像的相同的某个位置,计算得到每一幅图像上的特征值,并做好相应的标签,那么每一个特征都会对应一个弱分类器,那么这个弱分类器的阈值是怎么确定的呢?
将这个特征所计算出来的每一幅图像上的特征值进行排序,比如
1 2 3 4 5 6 7 8
正 负 正 正 正 负 正 负
现在需要学习一个阈值,那么这个特征值阈值theta,如果特征值大于theta,我假定为正例,小于的我就判断为负例。因为训练样本都是有标签的,就是我事先知道那个是正例,那个是负例。如上面标示的,特征值是2的是负例&#