一、四个基本概念
TP、True Positive 真阳性:预测为正,实际也为正
FP、False Positive 假阳性:预测为正,实际为负
FN、False Negative 假阴性:预测与负、实际为正
TN、True Negative 真阴性:预测为负、实际也为负。
【一致判真假,预测判阴阳。】
二、F1-score
F1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。
此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要,F2分数认为召回率的重要程度是精确率的2倍,而F0.5分数认为召回率的重要程度是精确率的一半。计算公式为:
G分数是另一种统一精确率和的召回率系统性能评估标准,G分数被定义为召回率和精确率的几何平均数。
三、查准率/查全率
1、精准度 / 查准率(precision):指被分类器判定正例中的正样本的比重
2、召回率 / 查全率 (recall):指的是被预测为正例的占总的正例的比重
3、另外,介绍一下常用的准确率(accuracy)的概念,代表分类器对整个样本判断正确的比重。
4、通过对第三步求得的各个类别下的F1-score求均值,得到最后的评测结果,计算方式如下:
三、其他
参考链接: ROC曲线与AUC值