模型评估标准
混淆矩阵
预测值=1 | 预测值=0 | |
---|---|---|
真实值=1 | TP | FN |
真实值=0 | FP | TN |
TP=True Postive=真阳性;FP=False Positive=假阳性
TN = True Negative=假阴性;FN=False Negative=假阴性
什么是查准率/精确率
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP
什么是查全率/召回率
R e c a l l = T P T P + F N Recall = \frac{TP}{TP+FN} Recall=TP+FNTP
什么是准确率
A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy = \frac{TP+TN}{TP+TN+FP+FN} Accuracy=TP+TN+FP+FNTP+TN
什么是F1分数(F1-score)
F1分数可以理解为P和R的调和平均数
F
1
=
2
P
R
P
+
R
F1=2\frac{PR}{P+R}
F1=2P+RPR
什么是P-R曲线
P-R曲线就是准确率precision和召回率recall的曲线,以recall作为横坐标,precision作为纵坐标。
什么是ROC曲线和AUC值
ROC曲线是以假阳性率FPR为横坐标,真阳性率TPR为纵坐标
T
P
R
=
T
P
T
P
+
F
N
F
P
R
=
F
P
F
P
+
T
N
TPR=\frac{TP}{TP+FN}\\ FPR=\frac{FP}{FP+TN}
TPR=TP+FNTPFPR=FP+TNFP
AUC表示ROC曲线下的面积,主要用于衡量模型的泛化能力,即分类效果的好坏。
如有错误,欢迎指正。谢谢