平衡采样
负样本的选择是一个很关键的问题。如果简单的采用所有的负样本,那么预测结果会偏向于负样本;另外,检测器在处理正负样本之间的样本区域的时候性能会下降。因此本文提出在输出特征图的每个像素上用二值mask来决定它是否参与训练。
忽略灰度区域
灰度区域是正负样本之间的区域,它既不是正样本也不是负样本,并且它的损失权重被设为0,也就是它不贡献任何loss。对于输出坐标空间中的每个非正样本标记的像素,只要它半径范围2内存在一个正样本标记的像素,则它的ignore flag=1
Hard Negative Mining
用HNM来挑选预测的很差的样本,在这些样本上进行梯度下降的学习可以使检测结果具有更强的鲁棒性。具体来说就是,将输出像素的分类损失降序排列,选择前1%作为hard-negative,也就是预测的很差的样本。在实验中保持正负样本比为1:1。在所有的负样本中,一半是hard-negative,一半是non-hard negative。
patch的选择
在训练时,如果一个patch中央的特定区域包含一个目标中心,那么它就是positive patch,这些patch中的负样本只为于正样本的周围。为了在整个数据集中找到完整的负样本,将训练图像裁剪成不同尺度的patch,然后resize到同一大小送入网络中,这种被称为random patch,positive patch与random patch之间的比例为1:1.