1 查全率与查准率
传统的信息检索评价指标主要是查全率与查准率,
查全率是指返回结果中相关文档数量与系统中总的相关文档数量的比率,主要反映检索系统召回相关结果的完整性。
查准率是指返回结果中相关文档的数量与结果总数的比值,反映检索系统查询结果的准确度。
recall = num(查询结果集中相关文档)/num(系统中总的相关文档)
precision = num(查询结果中相关文档)/num(查询结果总的文档)
查全率与查准率之间是相关的,总的结果数量越多,查全的可能性就越大,查全率就越高,相反误检的数量也越多,查准率也越多。反之亦然。
一个综合查全与查准的指标:F1(recall,precision) = 2recall*precision/(recall+precision)
查全率的计算(来源于互动百科):
衡量某一情报检索系统 从特定文献集合中检出相关文献成功度的一项指标。它的数值等于 w/x,式中 w为用户鉴别检出的 m篇文献时,认为实际对口径的文献篇数,x 为特定检索系统中所包括的全部 n篇文献中实际与某一课题相关的文献篇数。这一指标最初是由J.W.佩里 与A.肯特 等人于1956年提出的。