推荐系统常用评价指标及其 Python 实现

A-Egoist

已于 2023-06-03 10:27:17 修改

阅读量1.2k

点赞数 1

分类专栏：深度学习文章标签：机器学习算法深度学习

于 2023-05-08 19:12:05 首次发布

本文链接：https://blog.csdn.net/CesareBorgia/article/details/130565291

版权

深度学习专栏收录该内容

22 篇文章

订阅专栏

文章介绍了在Top-K推荐任务中常用的评价指标，包括Precision@K、Recall@K、HR@K、MRR@K和NDCG@K。Precision@K和Recall@K衡量了推荐列表中正确项目的比例，HR@K关注是否至少推荐了一个正确的项目，MRR@K考虑了推荐的顺序，而NDCG@K则在考虑顺序的基础上进行了归一化处理。这些指标用于评估推荐系统的性能和效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Precision@k。适用于 Top-K 推荐任务。

$Precision@K=\frac{\sum_{i=1}^{N}|R(i)\cap T(i)|}{\sum_{i=1}^{N}|R(i)|}\tag{1}$

$N$ 表示用户数， $i$ 表示用户 id， $R (i)$ 表示对用户 $i$ 的推荐列表， $T (i)$ 表示用户 $i$ 的真实访问的项目列表。

Recall@k。适用于 Top-K 推荐任务。

$Recall@K=\frac{\sum_{i=1}^{N}|R(i)\cap T(i)|}{\sum_{i=1}^{N}|T(i)|}\tag{2}$

$N$ 表示用户数， $i$ 表示用户 id， $R (i)$ 表示对用户 $i$ 的推荐列表， $T (i)$ 表示用户 $i$ 的真实访问的项目列表。

HR(Hit Ratio)@K。适用于 Top-K 推荐任务。

$HR@K=\frac{\sum_{i=1}^{N}hr(i)}{N}\tag{3}$

$hr(i)=\left\{\begin{array}{ll} 1 & , R(i) \cap T(i) \neq \varnothing \\ 0 & , R(i) \cap T(i)=\varnothing \end{array}\right.\tag{4}$

$N$ 表示用户数， $i$ 表示用户 id， $hr(\cdot)$ 表示命中函数， $R (i)$ 表示对用户 $i$ 的推荐列表， $T (i)$ 表示用户 $i$ 的真实访问的项目列表。

MRR(Mean Reciprocal Rank)@K。适用于 Top-K 推荐任务。

$MRR@K=\frac{1}{N}\sum_{i=1}^{N}\frac{1}{rank(i)}\tag{5}$

$N$ 表示用户数， $i$ 表示用户 id， $r ank (i)$ 表示对用户 $i$ 的推荐中，第一个命中的项目在推荐列表中的次序，若没有命中 $rank(i)\to\infty$ 。

NDCG(Normalized Discounted Cumulative Gain)@K。适用于 Top-K 推荐任务。

$CG@K=\sum_{i=1}^{K}rel(i)\tag{6}$

$rel(i)=\left\{\begin{array}{ll} 1 & , r[i] = t[i] \\ 0 & , r[i] \neq t[i] \end{array}\right.\tag{7}$

$DCG@K=\sum_{i=1}^{K}\frac{2^{rel(i)}-1}{log_{2}{(i+1)}}\tag{8}$

$IDCG@K=\sum_{i=1}^{K}\frac{1}{log_{2}{(i+1)}}\tag{9}$

$NDCG@K=\frac{DCG@K}{IDCG@K}\tag{10}$

NDCG@K 的计算对象是任一用户的推荐列表和其真实访问的项目列表。 $rel(\cdot)$ 表示相关函数，r 表示用户的推荐列表，t 表示用户真实访问的项目列表，IDCG (Idel Discounted Cumulative Gain)。

Python 实现

其中，Precision 是先求分子和分母之后再做除法，Recall 同样也是先计算分子和分母之后再做除法，HR 是求和命中数之后求均值，MRR 是计算排名的倒数和之后求均值，NDCG 是计算每个用户的真实列表和推荐列表的值然后求和再求均值。

def calc_precision_a(t, r):
    """
    The numerator of Precision
    t represent the true list for a user
    r represent the recommendation list for a user
    """
    return len([x for x in r if x in t])


def calc_precision_b(t, r):
	"""
	The denominator of Precision
    t represent the true list for a user
    r represent the recommendation list for a user
	"""
    return len(r)


def calc_recall_a(t, r):
    """
    The numerator of Precision
    t represent the true list for a user
    r represent the recommendation list for a user
    """
    return len([x for x in r if x in t])


def calc_recall_b(t, r):
	"""
	The denominator of Precision
	t represent the true list for a user
    r represent the recommendation list for a user
	"""
    return len(t)


def calc_hit(t, r):
    """
    calc the hit for a user
    t represent the true list for a user
    r represent the recommendation list for a user
    """
    for i in t:
        if i in r:
            return 1
    return 0


def calc_rank_reciprocal(t, r):
    for i in r:
        if i in t:
            return 1 / (t.index(i) + 1)
    return 0


def calc_ndcg(t, r):
    DCG, IDCG = [], []
    for i in range(min(len(t), len(r))):
        a = 1 if t[i] == r[i] else 0
        b = np.log2(i + 2)  # the index in the equation starts from 1, but in code it starts from 0.
        DCG.append(a / b)
        IDCG.append(1 / b)
    return np.sum(DCG) / np.sum(IDCG)


def evaluate(t, r):
    return calc_precision_a(t, r), calc_precision_b(t, r), calc_recall_a(t, r), calc_recall_b(t, r), calc_hit(t, r), calc_rank_reciprocal(t, r), calc_ndcg(t, r)


if __name__ == '__main__':
	Precision_a, Precision_b, Recall_a, Recall_b, HR, MRR, NDCG = [], [], [], [], [], [], []
    for u in range(1, num_users + 1):
        r = R[u]  # r
        t = T[u]  # t
        precision_a, precision_b, recall_a, recall_b, hr, mrr, ndcg = evaluate.evaluate(t, r)
        Precision_a.append(precision_a)
        Precision_b.append(precision_b)
        Recall_a.append(recall_a)
        Recall_b.append(recall_b)
        HR.append(hr)
        MRR.append(mrr)
        NDCG.append(ndcg)
    Precision = np.sum(Precision_a) / np.sum(Precision_b)
    Recall = np.sum(Recall_a) / np.sum(Recall_b)
    HR = np.mean(HR)
    MRR = np.mean(MRR)
    NDCG = np.mean(NDCG)
    print(f'Precision = {Precision}, Recall = {Recall}, HR = {HR}, MRR = {MRR}, NDCG = {NDCG}')