1. 检测精度
1.1 Precision, Recall, F1 score
Precision: 所有Positive的预测中(也就是预测为1),预测正确的比例。
Recall: 现实中为1的case中,被Positive预测(也就是预测为1,被正确预测了) 的比例是多少。所有正样本中被预测为正的比例。
精度Precision(查准率)评估预测的准不准
召回率Recall(查全率)评估找的全不全
1.2 IoU (Intersection over Union)
真实框与预测框的重叠率
为IoU设置一个阈值,比如如果IoU>=0.5,检测结果为True Positive(TP);如果IoU<=0.5,检测结果为False Positive(FP)。
1.3 P-R curve (Precison-Recall curve)
不同的阈值会导致精确率和召回率的变化,相应地,PR曲线会在precision-recall空间中绘制出各个阈值对应的点。
1.4 AP (Average Precision)
AP衡量学习出来的模型在每个类别上的好坏。
1.5 mAP (mean Average Precision)
mAP衡量的是学习出的模型在所有类别上的好坏。取所有类别上的AP的平均值。
2. 检测速度
2.1 前传耗时
从输入一张图像到输出最终结果所消耗的时间,包括前处理耗时(e.g 归一化)、网络前传耗时、后处理耗时(如非极大值抑制)
2.2 每秒帧数FPS (Frames Per Second)
每秒钟能处理的图像数量
2.3 浮点运算两(FLOPS)
处理一张图像所需要的浮点运算数量,跟具体软硬件没有关系,可以公平地比较不同算法之间的检测速度。