post process,以retinaface为例:
三个输出:(loc: bbox,cls: scores,pre: landmask)
min_sizes = { {16, 32}, {64, 128}, {256, 512}}; steps = {8, 16, 32};
1. 生成先验框priors,【输入有min_size,step.img_size】
feature map的大小由图片尺寸除以步长得到(img_size/step),对于feature map上的每一个点,都生成大小为min_size的anchors
2. decode boxes,【输入loc,priors,variances】
在先验框的基础上,结合推理得到的值,得出box的四个角坐标,缩放至原图
3.decode landm, 【输入有pre,priors,variances】
在先验框的基础上,结合推理得到的landmask,得出landmask,缩放至原图
4.filer,将置信度高于阈值的结果保留
5.topk
6.nms:其思想是搜素局部最大值,抑制极大值。目标检测的过程中在同一目标的位置上会产生大量的候选框,这些候选框相互之间可能会有重叠,此时我们需要利用非极大值抑制找到最佳的目标边界框,消除冗余的边界框。
前提:目标边界框列表及其对应的置信度得分列表,设定阈值,阈值用来删除重叠较大的边界框。
IoU:intersection-over-union,即两个边界框的交集部分除以它们的并集。
非极大值抑制的流程如下: