混淆矩阵有四个不同的类型,每种类型都由两个不同的词组成:
- 第一个词为True或者False,代表预测对了没有,True就是预测对了,False就是预测对了
- 第二个词为Positive或者Negtive,代表预测了个啥,Positive就是觉得结果是正样本,Negtive就是觉得结果是负样本。
由此进行排列组合就有四个不同结果:
- True Positive (TP):计算机认为是真值,计算机预测对了;
- False Positive (FP):计算机认为是真值,但是计算机预测错了;
- True Negative (TN):计算机认为是假值,计算机预测对了;
- False Negative (FN):计算机认为是假值,计算机预测错了。
根据以上4个结果,可以得到6个评价指标:
指标 | 公式 | 该指标关注的信息 |
---|---|---|
准确率(Accuracy) | = ( T P + T N ) / ( T P + F P + T N + F N ) = (TP+TN)/(TP+FP+TN+FN) =(TP+TN)/(TP+FP+TN+FN) | 整体样本中,预测正确的比例 |
错误率(Misclassification Rate) | = ( F P + F N ) / ( T P + F P + T N + F N ) = (FP+FN)/(TP+FP+TN+FN) =(FP+FN)/(TP+FP+TN+FN) | 整体样本中,预测错误的比例 |
召回率(Recall) | = T P / ( T P + F N ) = TP/(TP+FN) =TP/(TP+FN) | 正样本中,预测正确的比例 |
特异度(Specificity) | = T N / ( T N + F P ) = TN/(TN+FP) =TN/(TN+FP) | 负样本中,预测正确的比例 |
精确率(Precision) | = T P / ( T P + F P ) = TP/(TP+FP) =TP/(TP+FP) | 预测结果为正样本中,预测正确的比例 |
F1分数(F1 Score) | = ( T ∗ P r e c i s i o n ∗ R e c a l l ) / ( P r e c i s i o n + R e c a l l ) = (T * Precision * Recall) / (Precision + Recall) =(T∗Precision∗Recall)/(Precision+Recall) | 综合Precision和Recall的判断指标 |