在介绍指标之前,先回顾一下很重要的四个概念,可以说指标总是围绕着这四个来计算的。
真实 1 | 真实 0 | |
---|---|---|
预测 1 | true positive | false positive |
预测 0 | false negative | true negative |
记忆小技巧:true/false 后面的pos or neg与预测值有关,预测为1就是positive,为0就是negative,然后如果真实值和预测值一样,那就是true,不一样就是false。
Precision: | tp/tp+fp | 在所有预测1中有多少预测是正确的 | 针对预测1 |
---|---|---|---|
recall: | tp/tp+fn | 在所有真实 1中有多少预测是正确的 | 针对真实值1 |
accuracy: | tp+tn/tp+tn+fp+fn | 所有预测正确的 | 针对全部样本 |
F-score: | (1+P^ 2 ) * (precisionrecall)/P^2precision+recall |
当P=1时 就是F1 score,此时recall和precision都很重要,权重相同
当P=2时 就是F2 score&#