推荐系统常见评测标准之MAP与NDCG【转载】

转载自https://blog.csdn.net/simple_the_best/article/details/52296608

MAP
AP
关于 AP 与 MAP 这里有个非常好的文章: intuition-behind-average-precision-and-map

在了解MAP(Mean Average Precision)之前,先来看一下AP(Average Precision), 即为平均准确率。

对于AP可以用这种方式理解: 假使当我们使用google搜索某个关键词,返回了10个结果。当然最好的情况是这10个结果都是我们想要的相关信息。但是假如只有部分是相关的,比如5个,那么这5个结果如果被显示的比较靠前也是一个相对不错的结果。但是如果这个5个相关信息从第6个返回结果才开始出现,那么这种情况便是比较差的。这便是AP所反映的指标,与recall的概念有些类似,不过是“顺序敏感的recall”。

比如对于用户 uu, 我们给他推荐一些物品,那么 uu 的平均准确率定义为:

APu=1|Iteu|∑i∈Iteu∑j∈Iteuδ(puj≺pui)+1pui
APu=1|Iute|∑i∈Iute∑j∈Iuteδ(puj≺pui)+1pui
在这里 puipui 表示推荐列表中物品 ii 的排序位置。puj≺puipuj≺pui 表示在对用户 uu 的排序列表中物品 jj 的排序位置在物品ii 的前面。

上面的式子是不是挺唬人的,下面来分析一下

def AP(ranked_list, ground_truth):
    """Compute the average precision (AP) of a list of ranked items

    """
    hits = 0
    sum_precs = 0
    for n in range(len(ranked_list)):
        if ranked_list[n] in ground_truth:
            hits += 1
            sum_precs += hits / (n + 1.0)
    if hits > 0:
        return sum_precs / len(ground_truth)
    else:
        return 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
MAP
那么对于MAP(Mean Average Precision),就很容易知道即为所有用户 uu 的AP再取均值(mean)而已。那么则有:

MAP=∑u∈UteAPu|Ute|
MAP=∑u∈UteAPu|Ute|
NDCG
CG
先从后两个字母CG(Cummulative Gain)说起, 直接翻译的话叫做“累计增益”。 在推荐系统中,CG即将每个推荐结果相关性(relevance)的分值累加后作为整个推荐列表(list)的得分。

CGk=∑i=1kreli
CGk=∑i=1kreli
这里, relireli 表示处于位置 ii 的推荐结果的相关性,kk 表示所要考察的推荐列表的大小。

DCG
CG的一个缺点是没有考虑每个推荐结果处于不同位置对整个推荐效果的影响,例如我们总是希望相关性高的结果应排在前面。显然,如果相关性低的结果排在靠前的位置会严重影响用户体验, 所以在CG的基础上引入位置影响因素,即DCG(Discounted Cummulative Gain), “Discounted”有打折,折扣的意思,这里指的是对于排名靠后推荐结果的推荐效果进行“打折处理”:

DCGk=∑i=1k2reli−1log2(i+1)
DCGk=∑i=1k2reli−1log2⁡(i+1)
分子部分 2reli−12reli−1 
relireli越大,即推荐结果 ii 的相关性越大,推荐效果越好, DCG越大。

分母部分 log2(i+1)log2⁡(i+1) 
ii 表示推荐结果的位置,ii 越大,则推荐结果在推荐列表中排名越靠后,推荐效果越差,DCG越小。

NDCG
DCG仍然有其局限之处,即不同的推荐列表之间,很难进行横向的评估。而我们评估一个推荐系统,不可能仅使用一个用户的推荐列表及相应结果进行评估, 而是对整个测试集中的用户及其推荐列表结果进行评估。 那么不同用户的推荐列表的评估分数就需要进行归一化,也即NDCG(Normalized Discounted Cummulative Gain)。

在介绍NDCG之前,还需要了解一个概念:IDCG. IDCG, 即Ideal DCG, 指推荐系统为某一用户返回的最好推荐结果列表, 即假设返回结果按照相关性排序, 最相关的结果放在最前面, 此序列的DCG为IDCG。因此DCG的值介于 (0,IDCG](0,IDCG] ,故NDCG的值介于(0,1](0,1].

对于用户 uu 的NDCG@k定义为: 
NDCGu@k=DCGu@kIDCGu
NDCGu@k=DCGu@kIDCGu

这里的 kk 表示推荐列表的大小。
那么,则有: 
NDCG@k=∑u∈UteNDCGu@k|Ute|
NDCG@k=∑u∈UteNDCGu@k|Ute|
在具体操作中, 可以事先确定推荐目标和推荐结果的相关性分级。

例如可以使用 0,1分别表示相关或不相关,比如此处我们用refi=δ(i∈Iteu)refi=δ(i∈Iute) , 在这里如果 xx 为true, 则δ(x)=1δ(x)=1,否则δ(x)=0δ(x)=0.

或是使用 0~5 分别表示严重不相关到非常相关, 也即相当于确定了relrel 值的范围。之后对于每一个推荐目标的返回结果给定 relrel 值,然后使用DCG的计算公式计计算出返回结果的DCG值。使用根据排序后的 relrel 值序列计算IDCG值, 即可计算NDCG.

参见: 
szuthesis

原始参考: 
使用NDCG评估关键词推荐系统的相关性
--------------------- 
作者:liuchengxu_ 
来源:CSDN 
原文:https://blog.csdn.net/simple_the_best/article/details/52296608 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
由于MRR、MAPNDCG都是评估指标,需要根据具体的任务和数据集进行实现。以下是一些常见任务的评估指标实现示例: 1. 信息检索任务中的MRR实现: ```python def mean_reciprocal_rank(results, relevant_docs): for i, r in enumerate(results): if r in relevant_docs: return 1.0 / (i + 1) return 0.0 # 示例 relevant_docs = [1, 3, 5] results = [3, 4, 2, 1, 5] print(mean_reciprocal_rank(results, relevant_docs)) # 输出 0.3333 ``` 2. 信息检索任务中的MAP实现: ```python def average_precision(results, relevant_docs): precision = 0.0 num_relevant = 0 for i, r in enumerate(results): if r in relevant_docs: num_relevant += 1 precision += num_relevant / (i + 1) return precision / len(relevant_docs) def mean_average_precision(results_list, relevant_docs_list): map_score = 0.0 for results, relevant_docs in zip(results_list, relevant_docs_list): map_score += average_precision(results, relevant_docs) return map_score / len(results_list) # 示例 relevant_docs_list = [[1, 3, 5], [2, 4, 6], [3, 5, 7]] results_list = [[3, 4, 2, 1, 5], [3, 2, 4, 5, 1], [7, 6, 5, 4, 3]] print(mean_average_precision(results_list, relevant_docs_list)) # 输出 0.5 ``` 3. 推荐系统任务中的NDCG实现: ```python import numpy as np def ndcg(recommended_items, relevant_items, k): dcg = 0.0 idcg = np.sum(1.0 / np.log2(np.arange(2, k + 2))) for i, r in enumerate(recommended_items[:k]): if r in relevant_items: dcg += 1.0 / np.log2(i + 2) return dcg / idcg # 示例 recommended_items = [1, 2, 3, 4, 5] relevant_items = [1, 3, 5] print(ndcg(recommended_items, relevant_items, 5)) # 输出 0.6244 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值