nDCG 与 MAP, 排序模型的评价指标

yichudu

已于 2025-03-05 16:27:53 修改

阅读量1.7w

点赞数 3

CC 4.0 BY-SA版权

分类专栏：【ML------------通用文章标签： DCG 排序评价

于 2017-12-01 14:49:08 首次发布

天天开心

本文链接：https://blog.csdn.net/chuchus/article/details/78686628

【ML------------通用专栏收录该内容

32 篇文章

订阅专栏

本文介绍了信息检索领域中的评价指标DCG和nDCG，详细解释了这两个指标的计算方式及其应用场景，并通过对比说明了它们与推荐场景常用指标AUC的区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

简介

top-n 推荐领域的排序任务: 对候选集合作排列, 不仅要识别出样本的正负, 还要对正样本作进一步分档, 把更好的排在更前面.
再对比下分类任务: 仅需对一个样本(候选)作出识别即可.
更高一层的抽象: 也可以认为分类就是排序, 因为 ctr 预估的值域为 (0,1), 对 ctr_pred 作排序就是排序任务.

1. NDCG

NDCG, Normalized Discounted Cumulative Gain, 正规化的折扣累积收益.
是信息检索领域中, 对排序问题的一个评价指标, 因素有文档相关性与排序位置.
This measure is based on two following assumptions:

高度相关文档在排名靠前时, 对用户的帮助更大
高度相关文档比轻微相关文档, 对用户的帮助更大

Q: 与推荐场景常用的AUC, 有何区别?
A: 区别于评测样本的组织形式. ndcg 的样本为候选集合, auc 的样本是单个候选.

DCG

计算前k个结果的DCG.
$DCG@k=∑i=1krel(i)log⁡2(i+1)(1)\mathrm{DCG@k} = \sum_{i=1}^{k} \frac{rel_{(i)}}{\log_{2}(i+1)} \tag 1$
where $rel_{(i)}$ is i-th doc’s relevant score. $k$ is the rank position.
$y=1log⁡2(x+1)y=\frac 1{\log_2{(x+1)}}$ 图表见下, 位置越靠后, 重要性越低.
在这里插入图片描述