推荐系统常见评测标准之MAP与NDCG【转载】

最新推荐文章于 2021-11-18 20:49:22 发布

Tsaryu

最新推荐文章于 2021-11-18 20:49:22 发布

阅读量973

点赞数

分类专栏： t't't't't't

t't't't't't 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

转载自https://blog.csdn.net/simple_the_best/article/details/52296608

MAP
AP
关于 AP 与 MAP 这里有个非常好的文章: intuition-behind-average-precision-and-map

在了解MAP(Mean Average Precision)之前，先来看一下AP(Average Precision), 即为平均准确率。

对于AP可以用这种方式理解: 假使当我们使用google搜索某个关键词，返回了10个结果。当然最好的情况是这10个结果都是我们想要的相关信息。但是假如只有部分是相关的，比如5个，那么这5个结果如果被显示的比较靠前也是一个相对不错的结果。但是如果这个5个相关信息从第6个返回结果才开始出现，那么这种情况便是比较差的。这便是AP所反映的指标，与recall的概念有些类似，不过是“顺序敏感的recall”。

比如对于用户 uu, 我们给他推荐一些物品，那么 uu 的平均准确率定义为：

APu=1|Iteu|∑i∈Iteu∑j∈Iteuδ(puj≺pui)+1pui
APu=1|Iute|∑i∈Iute∑j∈Iuteδ(puj≺pui)+1pui
在这里 puipui 表示推荐列表中物品 ii 的排序位置。puj≺puipuj≺pui 表示在对用户 uu 的排序列表中物品 jj 的排序位置在物品ii 的前面。

上面的式子是不是挺唬人的，下面来分析一下

def AP(ranked_list, ground_truth):
"""Compute the average precision (AP) of a list of ranked items

"""
hits = 0
sum_precs = 0
for n in range(len(ranked_list)):
if ranked_list[n] in ground_truth:
hits += 1
sum_precs += hits / (n + 1.0)
if hits > 0:
return sum_precs / len(ground_truth)
else:
return 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
MAP
那么对于MAP(Mean Average Precision)，就很容易知道即为所有用户 uu 的AP再取均值(mean)而已。那么则有：

MAP=∑u∈UteAPu|Ute|
MAP=∑u∈UteAPu|Ute|
NDCG
CG
先从后两个字母CG(Cummulative Gain)说起, 直接翻译的话叫做“累计增益”。在推荐系统中，CG即将每个推荐结果相关性(relevance)的分值累加后作为整个推荐列表(list)的得分。

CGk=∑i=1kreli
CGk=∑i=1kreli
这里， relireli 表示处于位置 ii 的推荐结果的相关性，kk 表示所要考察的推荐列表的大小。

DCG
CG的一个缺点是没有考虑每个推荐结果处于不同位置对整个推荐效果的影响，例如我们总是希望相关性高的结果应排在前面。显然，如果相关性低的结果排在靠前的位置会严重影响用户体验，所以在CG的基础上引入位置影响因素，即DCG(Discounted Cummulative Gain), “Discounted”有打折，折扣的意思，这里指的是对于排名靠后推荐结果的推荐效果进行“打折处理”:

DCGk=∑i=1k2reli−1log2(i+1)
DCGk=∑i=1k2reli−1log2⁡(i+1)
分子部分 2reli−12reli−1
relireli越大，即推荐结果 ii 的相关性越大，推荐效果越好， DCG越大。

分母部分 log2(i+1)log2⁡(i+1)
ii 表示推荐结果的位置，ii 越大，则推荐结果在推荐列表中排名越靠后，推荐效果越差，DCG越小。

NDCG
DCG仍然有其局限之处，即不同的推荐列表之间，很难进行横向的评估。而我们评估一个推荐系统，不可能仅使用一个用户的推荐列表及相应结果进行评估，而是对整个测试集中的用户及其推荐列表结果进行评估。那么不同用户的推荐列表的评估分数就需要进行归一化，也即NDCG(Normalized Discounted Cummulative Gain)。

在介绍NDCG之前，还需要了解一个概念：IDCG. IDCG, 即Ideal DCG，指推荐系统为某一用户返回的最好推荐结果列表，即假设返回结果按照相关性排序，最相关的结果放在最前面，此序列的DCG为IDCG。因此DCG的值介于 (0,IDCG](0,IDCG] ，故NDCG的值介于(0,1](0,1].

对于用户 uu 的NDCG@k定义为：
NDCGu@k=DCGu@kIDCGu
NDCGu@k=DCGu@kIDCGu

这里的 kk 表示推荐列表的大小。
那么，则有：
NDCG@k=∑u∈UteNDCGu@k|Ute|
NDCG@k=∑u∈UteNDCGu@k|Ute|
在具体操作中，可以事先确定推荐目标和推荐结果的相关性分级。

例如可以使用 0，1分别表示相关或不相关，比如此处我们用refi=δ(i∈Iteu)refi=δ(i∈Iute) , 在这里如果 xx 为true, 则δ(x)=1δ(x)=1，否则δ(x)=0δ(x)=0.

或是使用 0~5 分别表示严重不相关到非常相关, 也即相当于确定了relrel 值的范围。之后对于每一个推荐目标的返回结果给定 relrel 值，然后使用DCG的计算公式计计算出返回结果的DCG值。使用根据排序后的 relrel 值序列计算IDCG值，即可计算NDCG.

参见：
szuthesis

原始参考：
使用NDCG评估关键词推荐系统的相关性
---------------------
作者：liuchengxu_
来源：CSDN
原文：https://blog.csdn.net/simple_the_best/article/details/52296608
版权声明：本文为博主原创文章，转载请附上博文链接！

Tsaryu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统常见评测标准之MAP与NDCG【转载】

转载自https://blog.csdn.net/simple_the_best/article/details/52296608MAPAP关于 AP 与 MAP 这里有个非常好的文章: intuition-behind-average-precision-and-map在了解MAP(Mean Average Precision)之前，先来看一下AP(Average Precision...
复制链接

扫一扫