信息检索 DCG、NDCG、AUC、BM25、F1-Score、AP

最新推荐文章于 2024-04-23 13:34:22 发布

·清尘·

最新推荐文章于 2024-04-23 13:34:22 发布

阅读量2.1k

点赞数

本文链接：https://blog.csdn.net/u012969412/article/details/81294609

版权

1、DCG

例子: 文章库内有4个文章 $d_1$ 、 $d_2$ 、 $d_3$ 、 $d_4$ 。针对查询Q，每个文档的打分分别为： $d_1=0分$ 、 $d_2=1分$ 、 $d_3=2分$ 、 $d_4=2分$ 。
查询Q在系统S中返回的结果顺序为: $d_3$ 、 $d_2$ 、 $d_4$ 、 $d_1$ 。

解：DCG公式为： $DCG_{RF}=\sum \frac{score_i}{log_2{(1+rank_i)}}$
查询的顺序与分数为： $d_3(2分)$ 、 $d_2(1分)$ 、 $d_4(2分)$ 、 $d_1(0分)$
所以 $DCG_{RF}=\frac{2}{log_2{2}} + \frac{1}{log_2{3}} + \frac{2}{log_2{4}} + \frac{0}{log_2{5}} = 4.584$

2、NDCG

例子（同上）: 文章库内有4个文章 $d_1$ 、 $d_2$ 、 $d_3$ 、 $d_4$ 。针对查询Q，每个文档的打分分别为： $d_1=0分$ 、 $d_2=1分$ 、 $d_3=2分$ 、 $d_4=2分$ 。
查询Q在系统S中返回的结果顺序为: $d_3$ 、 $d_2$ 、 $d_4$ 、 $d_1$ 。

解：NDCG公式为： $NDCG=\frac{DCG_{RF}}{IDCG}$
DCG公式为 $DCG_{RF}=\sum \frac{score_i}{log_2{(1+rank_i)}}$
IDCG为Grund Truth即最理想的查询结果: $IDCG=\sum \frac{GT_i}{log_2{(1+rank_i)}}$
查询的顺序与分数为： $d_3(2分)$ 、 $d_2(1分)$ 、 $d_4(2分)$ 、 $d_1(0分)$
所以 $DCG_{RF}=\frac{2}{log_2{2}} + \frac{1}{log_2{3}} + \frac{2}{log_2{4}} + \frac{0}{log_2{5}} = 4.584$
$IDCG=\frac{2}{log_2{2}} + \frac{2}{log_2{3}} + \frac{1}{log_2{4}} + \frac{0}{log_2{5}} = 7.170$
综上: $NDCG=\frac{DCG_{RF}}{IDCG}=\frac{4.584}{7.170}=0.639$

3、ROC与AUC

TP: 模型预测的正类是对的
FN: 模型预测的负类是错的
FP: 模型预测的正类是错的
TN: 模型预测的负类是对的

A为Ground-Truth B为predict
正确率 $Accuracy=\frac{TP+FN}{TP+TN+FP+FN}=\frac{U-A\cap{B}+A\cap{B}}{U}$

召回率 $Recall=\frac{TP}{TP+FN}=\frac{A\cap{B}}{A}$

精准度 $Precision=\frac{TP}{TP+FP}=\frac{A\cap{B}}{B}$

$F1=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}} = \frac{2PrecisionRecall}{Precision+Recall}$

（F1为 Recall和Precision的调和平均数）

假阳率（ROC曲线X轴） $FPR=\frac{FP}{FP+TN}$

真阳率（ROC曲线Y轴 ==召回率） $TPR=\frac{TP}{TP+FN}$

这里写图片描述
AUC就是曲线右下部分面积。

4、BM25

BM25公式 $d)=\sum_{i}^{n} W_i * R(Q_i,d)$

其中: Q是Query。 $Q_i$ 表示语素(切词后的语素，与词典库对应。如Q=保定驴肉火烧哪家强？ $Q_0$ =保定， $Q_1$ =驴肉)。 $W_i$ 表示: 语素 $Q_i$ 的权重，通常与TF-IDF排序成正相关。

5、AP

平均正确率(Average Precision, AP)：对不同召回率点上的正确率进行平均。

1) 未插值的AP:

某个查询Q共有6个相关结果，某系统排序返回了5篇相关文档，其位置分别是第1，第2，第5，第10，第20位，则AP=(1/1+2/2+3/5+4/10+5/20+0)/6。

2) 插值的AP:

只对返回的相关文档进行计算的AP, AP=(1/1+2/2+3/5+4/10+5/20)/5，倾向那些快速返回结果的系统，没有考虑召回率。

不考虑召回率情况下，单个查询评价指标还有：
（1）Precision@N：在第N个位置上的正确率，对于搜索引擎，考虑到大部分作者只关注前一、两页的结果，P@10,P@20对大规模搜索引擎非常有效
（2）NDCG
（3）Bpref：Binary preference，2005年首次引入到TREC的Terabyte任务中。

·清尘·

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
信息检索 DCG、NDCG、AUC、BM25、F1-Score、AP

1、DCG例子: 文章库内有4个文章 d1d1d_1、d2d2d_2、d3d3d_3、d4d4d_4。针对查询Q，每个文档的打分别为：d1=0分d1=0分d_1=0分、d2=1分d2=1分d_2=1分、d3=2分d3=2分d_3=2分、d4=2分d4=2分d_4=2分。查询Q在系统S中返回的结果顺序为: d3d3d_3、d2d2d_2、d4d4d_4、d1d1d_1。解：DCG公式为：...
复制链接

扫一扫