常用指标:
ACC precison recall f1_score PR AP MAP简介
正确率
- Accuracy
定义:(TP+TN)/(TP+FN+FP+TN)
即所有分类正确的样本占全部样本的比例
精度
- Precision、查准率
定义:(TP)/(TP+FP)
即预测是正例的结果中,确实是正例的比例
召回率
- Recall、查全率
定义:(TP)/(TP+FN)
即所有正例的样本中,被找出的比例
P-R曲线
- PRC
定义:根据预测结果将预测样本排序,最有可能为正样本的在前,最不可能的在后,依次将样本预测为正样本,分别计算当前的精确率和召回率,绘制P-R曲线。
在众多学习器对数据进行学习后,如果其中一个学习器的PR曲线A完全包住另一个学习器B的PR曲线,则可断言A的性能优于B。但是A和B发生交叉,那性能该如何判断呢?我们可以根据曲线下方的面积大小来进行比较,但更常用的是平衡点F1。平衡点(BEP)是P=R时的取值(斜率为1),F1值越大,我们可以认为该学习器的性能较好。F1的计算如下所示:
F1 = 2 * P * R /( P + R )
PR曲线应该是考虑 了多种数据划分比例下的PR 得分的连线
实际PR曲线不如直接参考F1得分
F1 值
定义:(2 * P * R)/(P + R)
RECALL和PRECISON的调和平均
ROC曲线
AP、MAP
查准率 = 查对的/查的总共数量
差错率= 差错的/查的总共数量
参考链接: https://www.jianshu.com/p/b425f5d9fae0