概念
- ROC是表示区分二分类真实情况的能力曲线图
- 最初该方法是为军事雷达人员设计的,这也是该名字的来源
符号意义
P(positive):代表在真实数据集中的正类
N(negative):代表在真实数据集中的负类
true positive (TP):正确命中
true negative (TN):正确拒绝
false positive (FP):错误警告,也称一型错误.
false negative (FN):本身是正类,但被错误判断为负类,丢失正类,也称二型错误
Null | positive | negative |
---|---|---|
Predicted Positive | TP(将正类预测正确) | FP(将负类错误预测为正类) |
Predicted Negative | FN(将正类错误预测为负类) | TN(将负类预测正确) |
公式
预测正确率
A
C
C
=
T
P
+
T
N
T
P
+
F
P
+
F
N
+
T
N
ACC = \frac{TP+TN}{TP+FP+FN+TN}
ACC=TP+FP+FN+TNTP+TN
正类发生率
P
r
e
v
a
l
e
n
c
e
=
T
P
T
P
+
F
P
+
F
N
+
T
N
Prevalence = \frac{TP}{TP+FP+FN+TN}
Prevalence=TP+FP+FN+TNTP
正类预测值Positive predictive value
P
P
V
=
T
P
T
P
+
F
P
PPV = \frac{TP}{TP+FP}
PPV=TP+FPTP
错误发生率
F
D
R
=
F
P
T
P
+
F
P
FDR = \frac{FP}{TP+FP}
FDR=TP+FPFP
召回率Recall
T
P
R
=
T
P
T
P
+
F
N
TPR=\frac{TP}{TP+FN}
TPR=TP+FNTP
伪正率(一类错误的发生率)
F
P
R
=
F
P
T
P
+
F
P
FPR=\frac{FP}{TP+FP}
FPR=TP+FPFP
ROC空间(ROC与x轴的面积)
ROC曲线是以FPR为横轴 TPR为纵轴的曲线,因此为了使结果尽可能可信\真实\可接受,所以TPR召回率尽量大,也就是让曲线往纵轴靠近,面积越接近