1.混淆矩阵
对于二分类模型,预测结果为正类或者负类。结合样本的真实类别,可以得到如下的混淆矩阵
预测为正类 | 预测为负类 | |
---|---|---|
实际为正类 | TP | FN |
实际为负类 | FP | TN |
其中TP、FP、TN、FN分别由T、F、P、N四个字母组合而成,含义见下表
缩写 | 全称 | 含义 |
---|---|---|
T | True | 表示分类正确 |
F | False | 表示分类错误 |
P | Positive | 表示正类 |
N | Negative | 表示负类 |
TP | True Positive | 表示真实类别为正类,分类结果也是正类(预测样本是正类,并且预测对了) |
FP | False Positive | 表示真实类别为负类,分类结果为正类(预测样本是正类,但是预测错了) |
TN | True Negative | 表示真实类别为负类,分类结果也是负类(预测样本是负类,并且预测对了) |
FN | False Negative | 表示真实类别为正类,分类结果为负类(预测样本是负类,但是预测错了) |
2.错误率:
-
定义: 预测错误的样本数占样本总数的比例
-
公式: 错 误 率 = 分 类 错 误 的 样 本 数 样 本 总 数 错误率 = \frac{分类错误的样本数}{样本总数} 错误率=样本总数分类错误的样本数
-
结合混淆矩阵: 错 误 率 = F P + F N T P + F P + T N + F N 错误率 = \frac{FP+FN}{TP+FP+TN+FN} 错误率=