混淆矩阵
混淆矩阵的基本概念
混淆矩阵分类模型的指标,属于模型评估的一部分。混淆矩阵的数值表示判断分类器(Classifier)的预测结果,适用于分类型的数据模型。其中数值包括真正里(True Positive),假正例(False Positive),真正例(True Negative),假负例(False Negative)。
- TN:真实值是负例,模型预测是负例的数量
- TP:真实值是正例,模型预测是正例的数量
- FN:真实值是正例,模型预测是负例的数量(第一类错误)
- FP:真实值是负例,模型预测是正例的数量(第二类错误)
混淆矩阵行列意义
- 真实负例总和 = TN+FP
- 真实正例总和 = FN+TP
- 模型判断为负例总和 = TN+FN
- 模型判断为正例总和 = FP+TP
混淆矩阵的指标运用
- 正确率(accuracy):模型预测正确的值和全部样本的比。可以观测分类模型预测正确占总体观测值的比重。
正 确 率 = T P + T N T P + T N + F P + F N 正确率 = \frac{TP+TN}{TP+TN+FP+FN} 正确率=T