Precision 和Recall是信息检索领域的常用评价指标。就直观意义而言,前者强调检索的精度,也即在所有检测到的结果中有多少是真正相关的;后者则强调检索的完整性,也成为查全率,关注在所有的相关记录中能够被检索到的比例,两者互为补充。
首先区别如下的关系:
相关 | 不相关 | |
找到 | A | B |
未找到 | C | D |
则使用公式可以表示为:
Precision = A/(A+B)
Recall = A/(A+C)
更加全面的介绍可以参见wikipedia:
https://en.wikipedia.org/wiki/Precision_and_recall
特别是其中的图示:
F-score 经常用来合并两者,常用的F1-score即为取两者的调和平均。