信息检索常用的性能评价指标

本文介绍了信息检索的评价指标,包括查全率和查准率的定义及计算方式,以及如何通过F1分数综合两者。此外,还探讨了TSAP、MAP和NDCG等其他性能指标,用于衡量检索系统的精确度和排序效果。
摘要由CSDN通过智能技术生成

1 查全率与查准率

传统的信息检索评价指标主要是查全率与查准率,

查全率是指返回结果中相关文档数量与系统中总的相关文档数量的比率,主要反映检索系统召回相关结果的完整性。

查准率是指返回结果中相关文档的数量与结果总数的比值,反映检索系统查询结果的准确度。

recall = num(查询结果集中相关文档)/num(系统中总的相关文档)

precision = num(查询结果中相关文档)/num(查询结果总的文档)

 

查全率与查准率之间是相关的,总的结果数量越多,查全的可能性就越大,查全率就越高,相反误检的数量也越多,查准率也越多。反之亦然。

一个综合查全与查准的指标:F1(recall,precision) = 2recall*precision/(recall+precision)

 

查全率的计算(来源于互动百科):

 

衡量某一情报检索系统 从特定文献集合中检出相关文献成功度的一项指标。它的数值等于 w/x,式中 w为用户鉴别检出的 m篇文献时,认为实际对口径的文献篇数,x 为特定检索系统中所包括的全部 n篇文献中实际与某一课题相关的文献篇数。这一指标最初是由J.W.佩里A.肯特 等人于1956年提出的。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值