Python — sklearn 分类效果评估
因为最近写的分类模型需要性能评价 ,常用的分类性能评价有 查准率、召回率、准确率、F1
分类问题的常用的包 sklearn ,下面对相关方法进行介绍
前提知识
对于我们的二分类问题,会有以下情况:
- 真正例(True Positive,TP):真实类别为正例,预测类别为正例。
- 假正例(False Positive,FP):真实类别为负例,预测类别为正例。
- 假负例(False Negative,FN):真实类别为正例,预测类别为负例。
- 真负例(True Negative,TN):真实类别为负例,预测类别为负例。
然后可以构建混淆矩阵(Confusion Matrix)如下表所示。
真实类别 | 预测类别 | 预测类别 |
---|---|---|
正例 | 负例 | |
正例 | TP | FN |
负例 | FP | TN |
ACC
A
c
c
=
(
T
P
+
T
N
)
/
t
o
t
a
l
Acc=(TP+TN)/total
Acc=(TP+TN)/total
准确率,又称查准率(Precision,P):
P
=
T
P
/
(
T
P
+
F
P
)
P=TP/(TP+FP)
P=TP/(TP+FP)
召回率,又称查全率(Recall,R):
R
=
T
P
/
(
T
P
+
F
N
)
R=TP/(TP+FN)
R=TP/(TP+FN)
F1值:
F
1
=
(
2
∗
P
∗
R
)
/
(
P
+
R
)
F1=(2*P*R)/(P+R)
F1=(2∗P∗R)/(P+R)
Acc 请看另外一篇文章: sklearn 计算 acc
查准率 请看另外一篇文章: sklearn 计算查准率
召回率 请看另外一篇文章: sklearn 计算召回率
F1 请看另外一篇文章:sklearn 计算 F1