hard negative mining(难例挖掘)
难例挖掘和非极大值抑制NMS一样,都是为了解决目标检测样本不平衡和低召回率的问题。
在目标检测过程中为了提高召回率,通常会提出很多Region Proposal(远超过实际数量的ground truth),但是大量的Region Proposal会使得训练时绝大部份都是负样本,为了保证样本均衡,需要对负样本进行抽样。
一般情况下选取正负样本的比例为1:3,且选择负样本中容易被分错类的困难负样本进行网络训练。
困难负样本:困难负样本一般与ground truth的IOU为二分之一,虽然是负样本但很容易被网络预测为正样本。
如何判断困难负样本?
选用初始样本集去训练网络,再用训练好的网络去预测负样本集中剩余的负样本,选择置信度误差较大的负样本作为困难负样本。