查全率、查准率都和正类样本密切相关。为了便于理解这几个概念,我们给出如图 1 所示的示意图。
查全率与查准率
图 1:查全率与查准率
图中实心小圆圈代表正类样本,空心小圆圈代表负类样本,大圆形区域(由两个半圆区域构成)代表被分类系统判断为正类的样本。
查全率
查全率(Recall,简称 R,又称召回率)表示分类准确的正类样本数占全部正类样本总数的比例。针对二分类有:
R=TP/(TP+FN)
举例来说,在信息检索领域,假设一个搜索引擎返回的相关页面只有 9 个,另外 3 个相关页面并没有返回而是散落在观测范围之外。那么此时,就查询系统而言,查全率就是指检索出来的相关页面占系统中全部相关页面的百分比。查全率可用图 2 中的子图 (a) 表示。查全率反映的是检索的全面性,其补数就是漏检率。
查全率和查准率示意图
图 2:查全率和查准率示意图
查准率
查准率(Precision,简称 P)表示被预测正确的正类样本数占分类器判定为正类样本总数的比例。针对二分类有:
P=TP/(TP+FP