第八章 信息检索的评价
1. 无序检索结果集合的评价
如何度量系统的效果?信息检索中最常用的两个指标是正确率和召回率。
- 正确率(Precision,简记为P): 返回的结果中相关文档所占的比例
Precision=返回结果中相关文档的数目/返回结果的数目 - 召回率(Recall,简记为R) : 返回的相关文档占所有相关文档的比例
Recall=返回结果中相关文档的数目/所有相关文档的数目
即: P = tp / (tp + fp), R = tp / (tp + fn)
还有一个融合了正确率和召回率的指标是F值,它是正确率和召回率的调和平均值。
当时,F计算公式可简化为
。