1、 准确率、精确率、召回率、F1-score
我们以分类算法为例,假设班里有50个同学,其中男生30个,女生20个,我们根据身高、体重、头发长度、声音分贝等等特征,想找到所有女生,比如已经有这样一个分类器了,得到结果如下:
这里我们是要找到所有女同学,故把女同学作为正样本(positive),男同学作为负样本(Negative),预测结果正确为True,预测结果错误为False。基于此,我们结合上面的数据给出如下定义和值:
TP(True Positive): 真实是女生,预测结果也是女生的数量(18个)
FN(False Negative): 真实是女生,预测结果是男生的数量(2个)
TN(True Negative): 真实是男生,预测结果也是男生(25个)
FP(False Postive): 真实是男生,预测结果是女生(5个)
准确率(Accuracy): 衡量所有样本被分类准确的比例
Accuracy=(TP+TN)/(TP+FP+TN+FN)
精确率(Precision): 也叫查准率,衡量正样本的分类准确率,就是说倍预测为正样本的样本有多少是真的正样本。
Precision=TP/(TP+FP)
召回率(Recall): 表示分类正确的正样本占总的分类正确样本的比例
Recall=TP/(TP+FN)
F1-score: 精确率和召回率的调和平均
2F/1=1/P+1/R⟹F1=2PR/(P+R)=2TP/(2TP+FP+TN)