推荐系统常见问题（三）：TopN 推荐是对训练集中的用户进行推荐，还是对测试集中的用户进行推荐？

最新推荐文章于 2024-09-08 09:28:34 发布

_ dingding_

最新推荐文章于 2024-09-08 09:28:34 发布

阅读量4.2k

点赞数 17

分类专栏： # 推荐系统常见问题

本文链接：https://blog.csdn.net/qiqi123i/article/details/104925774

版权

推荐系统常见问题专栏收录该内容

7 篇文章 8 订阅

订阅专栏

从我学习推荐系统以来，一直有个疑问深深的困扰着我，那就是到底是对训练集中的用户进行推荐，还是对测试集中的用户进行推荐呢？之所以一直苦思冥想是因为我认为这关系着我做的实验的的评估效果怎么样，比如 Precision 和 Recall。

一、误区产生的原因？

以下是我自己的苦思冥想（深深误区）

以TopN推荐为例，对于按照比例对数据集进行划分成训练集和测试集，那势必会有些用户只在训练集中出现而不在测试集中出现，有些用户只在测试集中出现，而不在训练集中出现。

按照对训练集中的用户进行推荐的做法，如果我对一个只在训练集中的用户进行推荐，可实际上他在测试集中压根没有出现过，自然也不会有他消费过的物品，那按照 Precision 的计算方法，对于这个用户来说，他的 Precision 妥妥的为0。

如果这样的用户很多，那我最后的平均 Precision 不是非常的低？并且这样的做法，有很多只在测试集中出现的用户是不会产生推荐列表的。
那为了加大我实验 Precision的数值，那我只对测试集中的用户进行推荐好了，这样测试集中有哪个用户我就对哪个用户去产生推荐结果，这样想来很完美！

但我又在疑惑，我要做的是推荐系统啊！我是用训练集里的用户数据进行训练的啊，我为什么不是对训练集中的用户进行推荐？？？（在机器学习里面这种想法应该是很正常的，我训练的是什么，我预测的就该是什么！）

而且我在很多论文以及项亮的《推荐系统实践》里面看到的说法都是，对训练集中的用户去进行推荐！

这样一来，对于到底该怎么做，我产生了深深的疑惑，网上的资料很多，大家的说法、写法也都不一致，我不知道该怎么说服自己，我在这上面纠结了非常久的时间！

一度，我甚至都想干脆直接用留一法（leave one out）划分数据集好了，这样用户会同时存在于训练集以及测试集中，那对训练集中的用户进行推荐，和对测试集中的用户进行推荐，效果是一样的！就不用这么纠结了，但这个方法治标不治本！

二、我现在终于释怀了！

现在我不纠结了。

我想明白了我的误区1其实存在于到底怎么去评估实验的好坏，比如Precision到底怎么算，而不是到底应该给训练集中的用户还是测试集中的用户去进行推荐。

正解1是按照我们对于测试集的理解，测试集的作用就是为了去验证算法的效果，对于推荐系统中的TopN 推荐来说，我们想验证的就是对于测试集中的用户，给他的推荐排序和实际测试集中该用户的Ground Truth 是否一样，我们给用户的推荐列表中是否有某个物品也存在于该用户的Ground Truth 中，如果是，我们称之为命中！

这样想明白了之后，还有一个误区2是我认为我是用训练集里的用户数据进行训练，我为什么不是对训练集中的用户进行推荐？而且推荐系统的本来目的就是给所有人进行推荐。

因为我相信 LibRec 这个开源库代码的正确性以及权威性，所以我一开始就决定详细这里的做法，所以我仔细研究了 LibRec 的代码，我明白了：

推荐，是给所有人进行推荐，甚至在 librec 中保存的推荐结果也是给所有人的推荐结果。
评估，只对测试集中的用户进行评估。

正解2是这两个部分不矛盾！，只是我一直混淆了概念！

以下是 LibRec 开源库中的评估器 Precision 中的部分代码，主要做法是：逐个遍历所有用户，如果该用户出现在测试集中，则拿该用户的推荐结果和测试集中该用户的 Ground Truth 进行对比。
在这里插入图片描述
以及我发现在 LibRec 中保存的推荐结果是对所有用户的推荐结果，而不是只保存测试集中用户的推荐结果，或者是训练集中用户的推荐结果。