1、nms
nms是非极大值抑制,在图片中ground truth只有几个,但是预测出来的框有很多,所以要进行框的抑制。
首先对所有的框进行排序,选取最大置信度框作为标准框,计算其余所有框和它的iou比值,大于iou阈值的框删除,该标准框作为最终框保留。
iou低于阈值的框,重复进行上一轮操作。最终筛选出最终的目标框。
1.1 soft nms
普通nms 大于iou阈值后直接删除,soft nms则对样本进行加权计算,
对样本设置新的置信度,最后再通过置信度阈值删去多余框。
2、map
mAP: mean Average Precision, 即各类别AP的平均值
AP: PR曲线下面积,其实是在0~1之间所有recall值的precision的平均值。
PR曲线: Precision-Recall曲线
Precision: TP / (TP + FP) tp/所有检测框 检测出来对的比例
Recall: TP / (TP + FN) tp/所有真实框 对的被检测出来的比例
2.1 方法一
iou>0.5设为tp,对各类别进行分别计算,再平均得出map
对置信度排序后,计算不同recall值对应的precision值,然后计算PR曲线下面积。设置0-1的11个点进行插值计算。
2.2 方法二
计算出PR曲线后,使用积分方法计算ap值,还选择0.5-0.95每隔0.05的iou比值计算一次ap值,最后再平均得出map