根据瓜的真实情况和学习器预测情况可以将分类结果划分为四类,简单起见,用(AB)表示。
A:如果预测结果与真实情况一致,则称T(True),否则为F(False)
B:如果预测结果为正例(好瓜),则表示为P(Positive),否则表示为N(Negative)
这样就有了混淆矩阵了:
(真实情况) (预测情况) | 正例(P) | 反例(N) |
---|---|---|
正例 | TP | FN |
反例 | FP | TN |
查准率(准确率):“准确”二字是站在学习器预测结果角度来说的。比如预测100个好瓜,其中有80个好瓜预测成了好瓜,那准确率就是80%
查全率(召回率):顾名思义,查全率是站在“总体样本的正例”的角度考察的。假设预测了100个瓜,里面50个好瓜,50个坏瓜,学习器把50个好瓜全部预测对了,但是50个坏瓜里面把一些瓜预测成了好瓜。这个例子的查全率就是100%,它不管你反例的预测结果的,50个好瓜全部正确预测出来了(召回了),那就是查全了。这叫宁可错杀一千,不可放过一个