【1】对于目标检测中我们会事先标记处ground truth,然后再算法中会生成一系列proposal,这些proposal有跟标记的ground truth重合的也有没重合的,那么重合度(IOU)超过一定阈值(通常0.5)的则认定为是正样本,以下的则是负样本。
【2】然后扔进网络中训练。However,这也许会出现一个问题那就是正样本的数量远远小于负样本,这样训练出来的分类器的效果总是有限的,会出现许多false positive,把其中得分较高的这些false positive当做所谓的Hard negative,既然mining出了这些Hard negative,就把这些扔进网络再训练一次,从而加强分类器判别假阳性的能力。
(要通过设置超参数设定使得假阴性尽可能的小,也就是拒绝被则假设。所以这个网络要足够好的条件,就是能够使得假阴性尽可能的小)
boosttraping
对于二分类问题,正样本数量远小于负样本数量。
当正负样本取相同数量的时候,会导致难以找到难例和正样本之前的差距。
1,随机采样,训练,得到分类器
2,分类器在训练集中训练。
3,将分错的数据单独做成集合。(包括假阳性和假阴性)
4,只用分错的数据来训练。
迭代循环。
hard negative mining
最新推荐文章于 2022-04-23 21:55:37 发布