混淆矩阵与PR曲线、ROC曲线的理解与使用
1.混淆矩阵
对于分类器而言,一个比较好的评估指标是混淆矩阵。下面通过一个表格具体展示在二分类器中的应用。
Neg(非A) | Pos(A) | |
---|---|---|
Neg(非A样本) | 90(TN) | 10(FP) |
Pos(A样本) | 30(FN) | 70(TP) |
其中Neg表示非A类,pos表示A类。从表格中可以得知,此分类器更能有效地识别非A样本,而对于A样本的识别能力不足。
据此我们还可以引出如下概念:
Precision和Recall都是针对某个类而言的,比如正类别的Recall,负类别的Recall等。如果你是10分类,那么可以有1这个类别的Precision,2这个类别的Precision,3这个类别的Recall等。
准确率 p r e c e s i o n = T P T P + F P . \mathcal{precesion}=\frac{TP}{TP+FP}. precesion=TP+FP