检索指标-精度/召回率

 一般的表述方式

FROM: <<现代信息检索>> 第二版, 第4章-检索评价

R为相关文档集, A为查询 q_{i}  在文档集 I 上查询返回的文档集, A\epsilon I, R\epsilon I.那么, 精度(正确率) p ( Precision), 召回率 r (Recall)的定义如下

 p = \frac{|R\cap A|}{|A|}

r = \frac{|R\cap A|}{|R|}

 

其他表述方式

FROM<<信息检索导论中文版>>

 相关(relevant)不相关(nonrelevant)
返回(retrieved)真正例(true positives, tp)伪正例(false positives, fp)
未返回(not retrieved)伪反例(false negatives, fn)真反例(true negatives, tn)

p=tp/(tp+fp)

r=tp/(tp+fn)

还有一个概念, 精确率(accuracy). 精确率指标在很多机器学习问题中的使用非常普遍,是一个非常适合这类问题的效果

度量指标。计算方式:

(tp+tn)/(tp+fp+fn+tn)

 然而,精确率对于信息检索来说并不是一个很好的度量指标。这一点也很容易解释:绝大多数情况下,信息检索中的数据存在着极度的不均衡性,比如通常情况下,超过99.9% 的文档都是不相关文档。

 

 

 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值