【推荐系统的评估】离线评估的方法

淅淅沥沥的小太阳

已于 2024-05-04 18:57:14 修改

阅读量433

点赞数 3

分类专栏：推荐系统文章标签：深度学习人工智能

于 2024-05-04 18:56:36 首次发布

本文链接：https://blog.csdn.net/m0_53259482/article/details/138447580

版权

14 篇文章 1 订阅

订阅专栏

离线评估的基本原理是在离线环境中，将数据集分为“训练集”和“测试集”两部分，⽤“训练集”训练模型，⽤“测试集”评估模型。

根据数据集划分方法的不同，离线评估可分为以下3种。

一、.Holdout检验

为了消除holdout检验的随机性，“交叉检验”的思想被提出。

特殊情况——留一验证：
- 主要做法：每次留下1个样本作为验证集，其余所有样本作为测试集。样本总数为n，依次遍历所有n个样本，进⾏n次验证，再将评估指标求平均得到最终指标。
- 缺点：在样本总数较多的情况下，留⼀验证法的时间开销极⼤。
- 留P验证：留⼀验证是留p验证的特例。留p验证是指每次留下p个样本作为验证集，⽽从n个元素中选择 p 个元素有种可能，因此它的时间开销远远⾼于留⼀验证，故很少在实际⼯程中应⽤。

不管是 holdout 检验还是交叉检验，都是基于划分训练集和测试集的⽅法进⾏模型评估的。然⽽，当样本规模⽐较⼩时，将样本集进⾏划分会让训练集进⼀步减⼩，这可能会影响模型的训练效果。

主要做法：基于⾃助采样法的检验⽅法，对于总数为n 的样本集合，进⾏n次有放回的随机抽样，得到⼤⼩为n的训练集。在n 次采样过程中，有的样本会被重复采样，有的样本没有被抽出过，将这些没有被抽出的样本作为验证集进⾏模型验证，就是⾃助法的验证过程。
优点：能够在样本量较小或者总体分布复杂的情况下进行统计推断，能够有效地避免了对总体分布的假设。
缺点：计算量较大、样本的偏差可能较大等。