这里首先介绍几个常见的模型评价术语,现在假设我们的分类目标只有两类,其中:总共有 P 个类别为 1 的样本,假设类别 1 为正例。总共有 N 个类别为 0 的样本,假设类别 0 为负例。
1)True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);
2)False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;
3)False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;
4)True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。
1.准确率 (Accuracy)
反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负。
2、精确度(Precision)
Precision其实就是在识别出来的图片中,正确地划分为正例的个数所占的比率
3、召回率(recall)
Recall 是所有正样本样例中,被正确识别为正样本的比例。
4、F1值
5、平均精度(Average-Precision,AP)与 mean Average Precision(mAP)
对于一个类别C,可能在多张图片上有该类别,则类别C的AP(average Precision)指数:AP=每张图片上的Precision求和/含有类别C的图片数目。
对于整个数据集而言,存在多个类别,不仅仅只有C,可能还会有C1、C2、C3:mAP=上一步计算的所有类别的AP和/总的类别数目,相当于所有类别的AP的平均值。
6、IoU(交并比)
IoU表示了预测产生的候选框(Region Proposal)与原图中标记框(Ground Truth)的重叠度。
7、FPS(Frame Per Second,每秒帧率)