介绍模型四个评价指标之前,先介绍一下混淆矩阵(Confusion Matrix):
混淆矩阵 (Confusion Matrix) | 真实值 | ||
正样本(Position) | 负样本(Negative) | ||
预测值 | 正样本(Position) | TP(True Position) | FP(False Position) |
负样本(Negative) | FN(False Negative) | TN(True Negative) |
TP(真正):被模型预测为正的正样本。
FP(假正):被模型预测为正的负样本。
FN(假负):被模型预测为负的正样本。
TN(真负):被模型预测为负的负样本。
1.准确率(Accuracy):对于给定的测试数据集,分类模型中所有预测正确的样本数/总观测值的样本数。ACC = (TP+TN)/(TP+TN+FP+FN)
2.精确率(Precision):衡量的检测系统的查准率, 在模型预测正确为正样本的个数/模型预测为正样本的个数。
Precision = (TP)/(TP + FP)
3.召回率(Recall):也是灵敏度(Sensitivity),衡量额检测系统的查全率,模型预测正确的正样本的个数/实际观测值数据中正样本的个数。
Recall = (TP)/(TP+FN)
4.F1值:为了能够评价不同算法的优劣,在Precision和Recall的基础上提出了F1值的概念。F1的定义如下:
F1=(精确率*召回率*2)/(精确率+召回率)
F1的取值在0-1之间,数值越大表示模型效果越好。
5.PR曲线
6.ROC曲线