精确度和召回率,是两个比较难以理解的模型评价指标。而且两者存在着难以兼得的关系。
计算方法
两种指标的计算公式如下:
其中,TP为正样本预测为真的数目,FP为负样本预测为真的数目,FN为正样本预测为假的数目。
二者的关系
两者的关系可以通过下面的一个二分类图进行说明:
对上图的两类训练一个分类器,会得到一个超平面,在图中将两类分割。假设圆圈是正样本,那么precision越高,要求超平面离三角越远越好,这样必然会造成一种结果——某些圆圈被划分到超平面左侧,被错误分类,会造成recall的下降。反之亦然。
因此这两个指标是一种矛盾的关系,不可兼得。实际中,看我们更加重视哪个指标。比如在人脸支付领域,要求不能错判,但是可以漏判,因此precision更重要;在疾病监测领域,要求不能漏判,但是可以接受错判,因此recall更重要。