【推荐】排序模型的评价指标nDCG

最新推荐文章于 2025-03-19 14:14:22 发布

征途黯然.

最新推荐文章于 2025-03-19 14:14:22 发布

阅读量6k

点赞数 2

分类专栏： # 推荐系统文章标签：算法推荐 nDCG DCG 排序

原创博客归本人所有，禁止任何人、组织、公司转载或采集！

本文链接：https://blog.csdn.net/qq_43592352/article/details/131936768

版权

推荐系统专栏收录该内容

5 篇文章

订阅专栏

nDCG是衡量排序模型性能的指标，考虑了排序正确性和相关性。它基于Gain、CG、DCG和IDCG计算，考虑了位置信息的折损。例如，在打分数据集中，nDCG可以评估模型预测的标签顺序与真实顺序的匹配度，分数越高表示性能越好。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

介绍

nDCG（Normalized Discounted Cumulative Gain）归一化折损累计增益是一种用于评估排序模型性能的指标，它考虑了两个方面：排序的正确性和相关性的程度。

学习nDCG按照Gain、CG、DCG、iDCG、nDCG这个顺序来学习。

假设现在你有一个标签序列：

	A	B	C	D
打分数据集	3	2	1	0
点击数据集	1	0	1	0

如果是打分数据集，那么A分数最高（3），D最低（0），这样真实顺序为ABCD；
如果是点击数据集，那么AC分数有（1），BD无（0），这样标签为AC，顺序无所谓；

增益Gain

增益Gain就表示第i个标签位置的得分。这里 $re l (i)$ 表示分数，这个分数到底是什么？分数是什么什么取决于数据集的对应位置存的是什么。

$G ain = re l (i)$

如果是用的是推荐的显示反馈，也就是打分数据集（1-5分），那么这个1-5的打分就是计算时要用的分数。如果用的隐式反馈，也就是用户点击数据集，那这个分数就是0-1。1表示用户点击过，0表示未点击过。

那么在上面举例中：在打分数据集，可以说标签A的增益为3、B为2……

累计增益 CG

累计增益 CG表示前k个位置累计得到的效益。CG必须要指定topk中的k才可以计算，不然在不同的情况下，A用户有100个标签、B用户只有10个标签，这样去统计CG就没意义了。

$\sum_{i=1}^{k} rel(i)$

那么在上面举例中：在打分数据集，如果标签为[A,B,C,D]或[B,A,C,D]，CG@2 = 5。所以，顺序不影响CG得分。如果我们想评估不同顺序的影响，就需要使用另一个指标DCG来评估。

折损累计增益 DCG

CG只是单纯累加相关性，不考虑位置信息。考虑排序顺序的因素，使得排名靠前的item增益更高，对排名靠后的item进行折损。CG与顺序无关，而DCG评估了顺序的影响。DCG的思想是：list中item的顺序很重要，不同位置的贡献不同，一般来说，排在前面的item影响更大，排在后面的item影响较小。

$\sum_{i=1}^{k} \frac{rel(i)}{\log_2(i+1)}$