常用: 平均精度均值 mAP,交并比 IoU,非极大值抑制 NMS, 每秒帧频FPS(每秒处理的图片数量)
1 AP:代表平均精度,是PR 曲线下的面积,分类器分类效果越好,AP 越大。
mAP:多类别的AP 的平均值,mean 代表对每个类别下得到的AP 再求平均。mAP 的取值范围为[0,1],值越大越好。
mAP 涉及到的相关概念: 混淆矩阵:TP,FP,FN,TN,Precision,Recall。
F1-score 是precision和recall 的调和均值:
即 2/F1=1/Precision +1/Recall
2 交并比 IoU
表示产生的候选框与真实标记框的重叠度,即二者的交集和并集的比值,IoU 越高,二者的相关度越高,最理想的情况下是候选框与真实标记框完全重合, 即IoU=1
3 非极大值抑制 NMS (Non-Maximum Suppression)
NMS 是目标检测框架中的后处理模块,主要用于删除高度冗余的bounding box。
NMS的算法基本步骤:
(1) 将所有检出的output_bbox 按cls score 划分(如 pascal voc 分20个类,也即将output_bbox 按照其对应的cls score 划分为21个集合,1个bg 类,只不过 bg 类 就没必要做NMS 而已)
cls_score: 分类层
(2)遍历每个集合,对每个集合单独 进行如下计算:
2.1 在每个集合内根据各个bbox 的cls score 做降序排序,得到一个降序的list_k。
2.2 从list_k 中第一个元素t0 开始,计算该元素与list_k中其他的元素ti 之间的 IoU,若IoU大于阈值,则剔除元素ti,否则,暂时保留ti
2.3 选择list_k 中的第二个元素ti,中被保留下的元素,重复进行2.2 操作,直至所有元素都完成筛选。
2.4 最后对每个几个list_k,对每个集合的list_k,重复2.2,2.3 中的迭代操作,直至所有list_k 都完成筛选。
4 每秒帧频FPS
每秒可以处理的图片数量。