1、accuracy、precision、recall
TP:实际为正,且划分为正的样本数,真正数。
FP:实际为负,且划分为正的样本数,假正数。
TN:实际为负,且划分为负的样本数,真假数。
FN:实际为正,且划分为负的样本数,假负数
- accuracy:准确率,预测正确的结果占总数的比例 (TP+TN)/(TP+FP+TN+FN)
- precision:精确率,预测为正且正确的样本占预测为正的样本比例,又叫查准率 TP/(TP+FP),精确率高意味着,只要识别出来是正的,就肯定是正的,侧重将不易区分的样本划分为负样本,考察的是识别出来的正样品是否靠谱。
- recall:召回率,预测为正且正确的样本占实际为正的样本比例,又叫查全率 TP/(TP+FN),召回率高意味着,只要是正的都能识别出来,侧重将不易区分的样本划分为正样本,考察的是对正样本是否敏感。
- Fb-score:综合考虑精确率和召回率的指标:(1+b^2)*Precision*Recall / (Precision+Recall)
2、宏平均、微平均
宏平均:先对每一个类统计指标值,然后再对所有类求算术平均值。
微平均:把所有类别的一次性都考虑进来,计算类别预测的准确率,前面的accuracy、precision、recall可以认为是微平均下的计算方法。
以两类分为为例:
得到宏平均:macro_avg= ( 10/(10+10) + 90/(90+10) ) /2 =0.7 (其实就是两类的精确率求平均)
得到微平均:micro_ave=( 100 / 100 + 20 )=0.83