一、混淆矩阵(误差矩阵)
混淆矩阵是评判模型结果的指标,属于模型评估的一部分。此外,混淆矩阵多用于判断分类器(Classifier)的优劣,适用于分类型的数据模型,如分类树(Classification Tree)、逻辑回归(Logistic Regression)、线性判别分析(Linear Discriminant Analysis)等方法。
- TP(True Positive):将正确类预测为正确类,真实为0,预测也为0
- FN(False Negative):将正确类预测为错误类,真实为0,预测为1
- FP(False Positive):将错误类预测为正确类, 真实为1,预测为0
- TN(True Negative):将错误类预测为错误类,真实为1,预测也为1
四个二级指标
混淆矩阵里面统计的是个数,有时候面对大量的数据,光凭算个数,很难衡量模型的优劣。因此混淆矩阵在基本的统计结果上又延伸了如下4个指标
- 准确率(Accuracy)—— 针对整个模型
- 精确率(Precision)
- 灵敏度(Sensitivity)即召回率(Recall) 衡量了分类器对正例的识别能力
- 特异度(