推荐系统评价指标介绍--CG, DCG, NDCG

最新推荐文章于 2025-04-30 11:32:16 发布

夜半罟霖

最新推荐文章于 2025-04-30 11:32:16 发布

阅读量1.6k

点赞数 23

文章标签：深度学习推荐算法人工智能

本文链接：https://blog.csdn.net/Dr_maker/article/details/136518767

版权

基础概念

首先明确CG这一系列指标既可用于打分场景，又可用于点击场景，用于判断模型给出的推荐列表 $\hat{y}$ 和用户打分（点击列表） $re l$ 之间的相似性。
基于CG的评价指标的计算 基础流程为：

依据前端的召回模型对生成TOP-K推荐列表 $\hat{y}$ ；
按照推荐列表的顺序提取相应的用户的打分列表 $re l$ ，进行排序；
计算这一顺序下的打分和；
这里需要明确，其他推文里常提到的所谓 “相关性”，简单认为是预先提供的用户打分Ground Truth即可。

指标介绍

CG@K(Cummulative Gain):推荐列表中前K个物品用户给出的打分和（如果是点击场景而非打分场景的话就是1，官方名称是相关性rel，实际没看出来和相关性的联系在哪）：
$CG=\sum_{i=1}^K rel_i$
其中 $re l$ 为按预测得到的推荐顺序得到的用户打分序列；
DCG@K(Discounted Cumulative Gain)：考虑了位置因素后对CG进行的修正，使得越靠前推荐的物品计算打分和时的权重更大：
$DCG=\sum^{K}_{i=1} \frac{rel_1}{log_2(i+1)}$
IDCG@KIdeal Discounted Cumulative Gain): 最理想的推荐列表的DCG得分，也就是将rel从大到小排布取前K个的DCG:
$IDCG=\sum^{K}_{i=1} \frac{rel'_1}{log_2(i+1)}$
其中 $re l^{'}$ 表示降序排列用户的打分表；
NDCG@K(Normalized Discounted Cumulative Gain): 归一化的折损累计增益，避免用户本身打分的倾向性（打高分或打低分）对评价指标造成影响；
$NDCG=\frac{DCG}{IDCG}$

举例

假定对前端召回模型输出的物品打分预测为： $\hat{y}=[70, 4, 0.3, 0.2, 0.1]$ ，用户对应物品的打分列表为 $KaTeX parse error: Undefined control sequence: \rel at position 1: \̲r̲e̲l̲=[5, 1, 0, 0, 1…$ ，那么有：
$CG@2=5+1=6\\ DCG@2=5+\frac{1}{log_2 3}=5.6309\\ IDCG@2=10+\frac{5}{log_23}=13.1546\\ NDCG@2=13.1546/5.6309=2.3361$