1. 精确率-Precision、召回率Recall
先来讲一下精确率(Precision)和准确率(Recall),首先要明确一点,精确率不等于准确率(Accuracy),两者是不同的,后面也会讲到准确率。在信息检索里,精确率和召回率也被称为查准率、查全率
首先熟悉4个定义:
TP (True Positive): 正确被预测为正样本–即原来是正样本
FN (False Negative): 错误预测为负样本–即原来是正样本
TN (True Negative): 正确识别为负样本 --即原来是负样本
FP (False Postive): 错误识别为正样本–即原来是负样本
下面以个简单的例子实践一下:
假如我们正在做猫狗的二分类识别任务,假设狗是正样本,猫是负样本,
数据里共有100张图片,狗为65张,猫为35张,而我们的预测结果:
识别成狗的有75张,正确识别的55张,识别成猫的25张,正确的15张,那么关系表就如下
精确率,是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本:
也就是说识别成狗的样本里,正确的比例,例子里就等于55/(55+20) ≈ \approx ≈ 73%
召回率,是针对我们原来的样本而言的,它表示的是原来样本中的正例有多少被预测正确了,也即 真实准确的正预测在原来样本的正例中所占的百分比:
也就是说,狗的召回率等于55/(55+10) ≈ \approx ≈ 85%
准确率,对于给定的数据,分类正确的样本数占总样本数的比例,可用于多分类,这个也是最好理解的
整个二分类的准确率=(55+15)/100 = 70%
2. F1-score
很多时候,模型不只关心其中某个指标,因此需要平衡精确率和召回率,因此就有了F1-score,F1值是精确率和召回率的调和均值
作者:copain_sir
链接:https://www.jianshu.com/p/b29bfbf05ecf
来源:简书