参考链接:
1、https://blog.csdn.net/blueblood7/article/details/41823593
2、https://blog.csdn.net/lijiao1181491631/article/details/54407830?utm_source=blogxgwz0
3、https://blog.csdn.net/u014696921/article/details/74435229
1、混淆矩阵
预测 | 预测 | ||
---|---|---|---|
正 | 负 | ||
实际 | 正 | TP | FN |
实际 | 负 | FP | TN |
- TP:true positive,实际为正的,预测成正的个数
- FN:false negative,实际为正的,预测成负的个数
- FP:false positive,实际为负的,预测成正的个数
- TN:true negative,实际为负的,预测成负的个数
2、TPR/FPR/TNR/FNR
即上面提到的TP/FN/FP/TN的比率
-
TPR:true positive rate,真正率,敏感性sensitivity,实际为正的,预测成正的比率
T P R = T P T P + F N TPR= \frac{TP}{TP+FN} TPR=TP+FNTP -
FNR:false negative rate,假负率,实际为正的,预测成负的比率
F N R = F N T P + F N FNR= \frac{FN}{TP+FN} FNR=TP+FNFN -
FPR:false positive rate,假正率,实际为负的,预测成正的比率
F P R = F P F P + T N FPR= \frac{FP}{FP+TN} FPR=FP+TNFP -
TNR:true negative rate,真负率,特异性specificity,实际为负的,预测成负的比率数
T N R = T N F P + T N TNR= \frac{TN}{FP+TN} TNR=FP+TNTN
3、ROC/AUC
ROC曲线:受试者工作特征曲线:receiver operating characteritic curve,又称为感受性曲线(sensitivity curve),表示敏感性和特异性之间的相互关系。
横坐标为FPR,纵坐标为TPR,如下图所示,ROC曲线上的每一个点对应一个threshold,
其中,有三种极限状态:
- TPR=0,FPR=0,这时threshold最大,将每个实例都预测为负类;
- TPR=1,FPR=1,这时threshold最小,将每个实例都预测为正类;
- TRP=1,FPR=0,理想模型,所有实例都预测准确。
一个好的分类模型,其曲线应该尽可能靠近上图的左上角。如果是随机猜测模型,则位于图中的主对角线上。
AUC:ROC曲线下方的面积,area under the ROC curve。另一种评价模型性能的方式,如果模型是完美的,则AUC=1,如果模型是随机猜测模型,则AUC=0.5,模型性能越好,则面积越大。
4、FAR/FRR/EER
人脸识别一般分为Indentification和Verification(人脸验证),当进行人脸验证时,一般考虑以下两个指标:
- 误识率(False Accept Rate,,FAR):将其他人误作指定人员的概率
- 拒识率(False Reject Rate,FRR):将指定人员误作其它人员的概率。
- 等错误率 (EER-Equal Error Rate) :取一组0到1之间的等差数列,分别作为识别模型的判别界限,既坐标x轴,画出FFR和FAR的坐标图,交点就是EER值。
F A R = N o n t a r g e t I s T a r g e t ( T a r g e t I s T a r g e t + N o n t a r g e t I s T a r g e t ) FAR = \frac{NontargetIsTarget } {( TargetIsTarget + NontargetIsTarget ) } FAR=(TargetIsTarget+NontargetIsTarget)NontargetIsTarget
F R R = T a r g e t I s N o n t a r g e t ( T a r g e t I s N o n t a r g e t + N o n t a r g e t I s N o n t a r g e t ) FRR = \frac{TargetIsNontarget} {( TargetIsNontarget + NontargetIsNontarget ) } FRR=(TargetIsNontarget+NontargetIsNontarget)TargetIsNontarget
一般,FAR=0.001时,FRR的值作为参考。值越小,性能越好。
计算机在判别时采用的阈值不同,这两个指标也不同。一般情况下,误识率FAR 随阈值的减小(放宽条件)而增大,拒识率FRR
随阈值的减小而减小。因此,可以采用等错误率(Equal Error Rate,
ERR)作为性能指标,即通过调节阈值,使这FAR和FRR两个指标相等时的FAR 或 FRR。
另一种关于FAR、FRR的解释如下:
5、FMR、FNMR
FMR:False match rate
FNMR:False non-match rate
F
A
R
=
F
M
R
∗
(
1
–
F
T
A
)
FAR = FMR * (1 – FTA)
FAR=FMR∗(1–FTA)
F
R
R
=
F
T
A
+
F
N
M
R
∗
(
1
–
F
T
A
)
FRR = FTA + FNMR * (1 – FTA)
FRR=FTA+FNMR∗(1–FTA)
错误采集率 failure-to-acquire rate FTA: 在辨识或验证的尝试中,采集不到样本或样本质量无法达到要求的比例。
6、GFAR、GFRR
GFAR :广义误接受率,Generalized false accept rate
GFRR :广义误拒绝率,Generalized false reject rate
广义上的错误拒绝发生在:
- 测试对象没有注册
- 不能提取提交的样本
- 存在错误匹配
广义上的错误接受和错误拒绝率将由下述公式给出:
G
F
A
R
=
F
M
R
∗
(
1
–
F
T
A
)
∗
(
1
–
F
T
E
)
2
GFAR = FMR * (1 – FTA) * (1 – FTE)^2
GFAR=FMR∗(1–FTA)∗(1–FTE)2
G
F
R
R
=
F
T
E
+
(
1
–
F
T
E
)
∗
F
T
A
+
(
1
–
F
T
E
)
∗
(
1
–
F
T
A
)
∗
F
N
M
R
GFRR = FTE + (1 – FTE) * FTA + (1 – FTE) * (1 – FTA) * FNMR
GFRR=FTE+(1–FTE)∗FTA+(1–FTE)∗(1–FTA)∗FNMR
FTE:注册失败率 failure-to-enroll rate