微平均、宏平均:
一种计算方法是把所有类别的一次性都考虑进来,计算类别预测的准确率。(微平均)
另外还有一种是对每个类别分开考虑,计算单独每个类别的准确率,最后再进行算术平均得到该测试集的准确率。(宏平均)
其中微平均 recall = precise = f1-score 无论是二分类还是多分类, 因为要统计所有的类别, 所以TP为各个类别分对的数目的总和, FP= FN 为各个类别分错数目的总和,recall = precise = 正确分类 / (正确分类 + 错误分类)
所以:average(宏平均) 会比 micro-average(微平均) 好一些哦,因为macro会受minority class影响更大,也就是说更能体现在small class上的performance。
对 TP、TN、FP、FN的理解:
病毒检测的场景: 真阳、真阴、假阳、假阴
阳和阴指的是检测结果
真和假指的是实际情况