推荐系统常用评价指标

最新推荐文章于 2023-10-23 16:31:12 发布

sa726663676

最新推荐文章于 2023-10-23 16:31:12 发布

阅读量336

点赞数 1

分类专栏：推荐系统算法

本文链接：https://blog.csdn.net/sa726663676/article/details/113092342

版权

推荐系统算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

自己在网上查询了很多推荐指标包括准确率，精确率，召回率，P-R曲线，AUC曲线，MAP，MRR，NDCG评价指标。
但是分类模型的评价指标和推荐系统的指标的计算方法是不一样的，分类模型评价指标计算是根据混淆矩阵进行计算，而推荐模型是根据推荐列表和分割的20%测试集作为真实值进行计算。
在分类模型中，是明确知道分类的明确信息，比如哪个属于正样本，哪些属于负样本，而在推荐系统中我们只是将测试集作为正样本进行计算，分类模型中的假阳性等信息并不知道。因为推荐列表不像分类问题一样，将不出现测试集中的样本看成是负样本（因为我们无法判断用户对于没访问过的项目是不是真的不感兴趣），因此准确率（正确分类样本数/样本总数，正确分类数包括正负样本），P-R曲线，AUC曲线这些评价指标无法或很少在推荐系统使用

推荐系统的常用指标：精确率，召回率，F1-Score，MAP，NDCG
推荐系统准确率计算方法：
精确率=||推荐集并测试集||/||测试集|| #又叫查全率，用于评价模型查的全不全
召回率=||推荐集并测试集||/||推荐集|| #又叫查准率，用于评价模型查的信息准不准
上面两个评价指标会相互制约，最好的情况是两者结果都为1,。通常另一个大会导致领一个小。
举个极端的例子，如果推荐集包含全部元素了，而测试集包括很少，这时候精确率为1，而召回率为几乎为0.
最好的情况是推荐集和测试集的项目一模一样，这时候是最好的情况，都为1.

MAP和NDCG的计算：
https://blog.csdn.net/simple_the_best/article/details/52296608
https://www.cnblogs.com/baiting/p/5138757.html
MAP和NDCG理解：
MAP只是希望我们想要的信息项目靠前，比如我们想要（a1，a2，a3），一个推荐列表【a1，a2，a3，b1，b2，b3】要比【，b1，b2，b3，a1，a2，a3】的分数高。但是【a1，a2，a3，b1，b2，b3】和【a3，a2，a1，b1，b2，b3】得到的结果一样，显然第一种情况好，因此这种评价指标无法解决这个问题
针对上面MAP存在的问题，提出了NDCG评价指标，该指标通常用于网页的搜索排名中，不仅让想要的信息的排名信息靠前，也让和信息（比如搜索关键字）更相关的信息排名靠前的推荐列表的分数也越大。

sa726663676

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
推荐系统常用评价指标

MAP和NDCG：https://blog.csdn.net/simple_the_best/article/details/52296608https://www.cnblogs.com/baiting/p/5138757.html
复制链接

扫一扫