检索式问答指标

本文介绍了信息检索中的核心指标,包括精确率、召回率和准确率的定义及计算方式。通过混淆矩阵展示了相关文档与返回文档的关系,并探讨了这些指标在评估查询结果质量中的作用。此外,还提到了相关性和差异性在标签系统中的重要性。
摘要由CSDN通过智能技术生成

检索式问答指标

通用的表达形式

精确率
p = ∣ R ∩ A ∣ ∣ A ∣ p = \frac{|R \cap A|}{|A|} p=ARA

召回率
r = ∣ R ∩ A ∣ ∣ R ∣ r= \frac{|R \cap A|}{|R|} r=RRA

R R R为相关文档集, A A A为查询 q i q_{i} qi 在文档集 I 上查询返回的文档集, A ϵ I A \epsilon I AϵI, R ϵ I R \epsilon I RϵI

混淆矩阵表示形式

相关(relevant)不相关(nonrelevant)
返回(retrieved)真正例(true positives, tp)伪正例(false positives, fp)
未返回(not retrieved)伪反例(false negatives, fn)真反例(true negatives, tn)

精确率
p = t p t p + f p p = \frac{tp}{tp + fp} p=tp+fptp

召回率
r = t p t p + f n r = \frac{tp}{tp + fn} r=tp+fntp

准确率
a ( a c c u r a c y ) = ( t p + t n ) ( t p + f p + f n + t n ) a(accuracy) = \frac{(tp+tn)}{(tp+fp+fn+tn)} a(accuracy)=(tp+fp+fn+tn)(tp+tn)

参考

检索指标-精度/召回率

欢迎关注公众号:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值