【推荐算法】从零开始做推荐（二）——TopK推荐的评价指标，计算原理与样例

最新推荐文章于 2025-03-05 21:50:54 发布

lechuan_dafo

最新推荐文章于 2025-03-05 21:50:54 发布

阅读量1.3w

点赞数 24

分类专栏：推荐算法文章标签：推荐系统

本文链接：https://blog.csdn.net/qq_34862636/article/details/105010511

版权

这篇博客详细介绍了推荐系统中的TopK推荐评价指标，包括Precision、Recall、F1值、命中率(HR)、平均到数排名(MRR)、平均精度均值(MAP)和归一化折损累计增益(NDCG)。文章通过公式解析和样例计算，帮助读者理解这些指标的计算原理和应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

推荐系统的评价指标在不同类型的推荐场景下，选用的不同。有些推荐的评价指标并非完全出自推荐系统，而是从搜索算法，信息检索，机器学习等相关领域沿用过来，因此网上有些对评价指标的解释并非完全以推荐系统的角度进行，这让我会在学习的时候产生困惑，特此做出一些整理，力求完全用推荐系统的角度解释，并给出计算的具体流程。

如果你对本系列(未写完，持续更新中)感兴趣，可接以下传送门：
【推荐算法】从零开始做推荐（一）——认识数据
【推荐算法】从零开始做推荐（二）——推荐系统的评价指标，计算原理与实现样例
【推荐算法】从零开始做推荐（三）——传统矩阵分解的TopK推荐实战
 【推荐算法】从零开始做推荐（四）——python Keras框架利用Embedding实现矩阵分解TopK推荐
 【推荐算法】从零开始做推荐（五）——贝叶斯个性化排序矩阵分解 (BPRMF) 推荐实战
 【推荐算法】从零开始做推荐（六）——贝叶斯性化排序矩阵分解 (BPRMF) 的Tensorflow版

TopK 推荐评价指标

TopK推荐

定义：TopK推荐顾名思义，首先推荐给用户的项目数是K个，其次，这些推荐依据用户对项目的“评分”进行从高到低排序展示给用户。
举例：打开淘宝后给你推荐的TopK个商品；
特点：将推荐视为分类问题，如给定一个用户，其将要访问的项目作为其分类的标签，而对该用户的TopK推荐即为模型对该用户的多分类结果。
因此TopK推荐的评价指标也大多为分类问题指标沿用演化而来。

Precision 精确度，Recall 召回率

我最初了解它们，是出自机器学习分类问题里经典的混淆矩阵。网上有部分解释也是沿用混淆矩阵，但这会让我对于 $T o p K$ 推荐直观理解会造成困难，因此直接以推荐算法角度给出计算公式：
$\begin {aligned} Precision@K = \frac { \sum_{i=1}^N|R(i)∩T(i)|}{\sum_{i=1}^N|R(i)|} ….…(1)\\ Recall@K = \frac {\sum_{i=1}^N|R(i)∩T(i)|}{\sum_{i=1}^N|T(i)|}….…(2) \end{aligned}$

下面对公式(1)(2)中的变量进行解释.
$i$ ：第 $i$ 次推荐。
$R (i)$ ：第 $i$ 次推荐中，推荐的项目列表。
$T (i)$ ：第 $i$ 次推荐中，用户真实访问的项目列表。
$K$ ： $T o p K$ 推荐中推荐列表的长度。
$N$ ：总推荐次数。
大多数场景下，对每一个用户进行一次 $T o p K$ 推荐，因此 $n$ 常为测试集中的用户， $N$ 常为测试集中的用户数量。
实际上， $P r e c i s i o n @ K$ 和 $R e c a l l @ K$ 的分子都是单次推荐时命中数量的累加，区别在分母， $R e c a l l @ K$ 的分母要按实际情况进行累加，但 $P r e c i s i o n @ K$ 的分母是推荐列表长度的累加，可以很轻松的得出： $\sum_{i=1}^N|R(i)|=N×K$ 。
注意： $P r e c i s i o n @ K$ 和 $R e c a l l @ K$ 的计算都是先累加再相除，不能写成先相除再累加。
思考： $P r e c i s i o n @ K$ 和 $R e c a l l @ K$ 的值域在每次推荐都命中的情况下一定为1吗？这受 $R (i)$ 和 $T (i)$ 的长度影响。对每次推荐而言， $∣ R (i) ∣ = K$ 是定长的，而 $∣ T (i) ∣$ 是变长的。
当任意的 $∣ T (i) ∣$ 都小于 $∣ R (i) ∣ = K$ 时，有 $\sum_{i=1}^N|T(i)|<\sum_{i=1}^N|R(i)|$ ，在每次都命中的前提下，：
$\frac { \sum_{i=1}^N|R(i)∩T(i)|}{\sum_{i=1}^N|R(i)|}= \frac { \sum_{i=1}^N|T(i)|}{\sum_{i=1}^N|R(i)|}<1\\Recall@K = \frac {\sum_{i=1}^N|R(i)∩T(i)|}{\sum_{i=1}^N|T(i)|}=\frac { \sum_{i=1}^N|T(i)|}{\sum_{i=1}^N|T(i)|}=1$