1 Group Sampling for scale invariant face detection
问题,训练样本中存在两种不均衡:
1 正负样本不均衡,负样本个数远大于正样本个数。
2 不同尺度上训练样本不均衡:比如retinaface在三个尺度上进行人脸检测,每隔尺度上的训练样本个数不均衡(由于基于iou的anchor匹配策略,小的物体更不容易找到合适的anchor):
不同的方式对应的anchor、stride设定
widerface训练集下不同的方式对应的不同尺度下的正负anchor数量,使用总的训练样本数据进行归一化
在retinaface中,其anchor设定如下:
在retinaface中anchor设定75%都在P2层,但是训练样本却不一定是都在P2层,所以这篇文章没有考虑另外一个不平衡,不同尺度下anchor的均衡?(但是不同尺度下的anchor很自然的就不均衡,图像中大脸的最大个数肯定比小脸的最大个数要少),但是anchor的不均衡,对训练有影响吗?
在group sampling这篇文章中,给出的解决方案如下:
1 将所有的样本,按照anchor尺度进行分组。
2 在每个组内,对政府样本按照1:3进行采样,各个组之间的训练样本数量保持一致
3 如果那个尺度内的正样本缺失或者未达到要求比例,就在这个组内增加负样本,以确保各个组之间的训练样本数量相同
最后得到的结果如下:
2 freeanchor(不是不需要anchor,只是每个groundtruth对应的anchor不再固定,而是自由可选)
核心思想:手动分配的anchor在一下两种情况存在问题:
1 没有中心特征的细长物体
2 多个物体挤在一起
1 groundtruth的候选anchor:对训练时的每个groundtruth,根据anchor与groundtruth之间的iou排序,取前k个作为该groundtruth的候选anchor
2 学习从候选的anchor中得到最佳匹配的anchor:学习时使用下面的公式(原文):
学习到的anchor不一定是最对齐的anchor,但却是最有代表性的特征
最终结果:
对细长物体、多个物体拥挤在一起的情况有改善