《推荐系统实践》自己随手写的感想+重点

最新推荐文章于 2022-07-29 15:31:42 发布

你不定积分没加C�

最新推荐文章于 2022-07-29 15:31:42 发布

阅读量380

点赞数

分类专栏：推荐系统与深度学习文章标签：推荐系统深度学习算法

本文链接：https://blog.csdn.net/cuicuicuicuicuih/article/details/105374154

版权

推荐系统与深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

今天开始读《推荐系统实践》这本书了，所以想先搁浅一下《推荐系统与深度学习》的笔记，一起更吧，哎太懒了。

第一章：好的推荐系统

略了吧，主要介绍了一些很牛逼的视频网站啊或者其他网站用的推荐系统对他们带来了什么好的影响啊。像是广告啊，音乐啊，视频啊，新闻啊等等，都需要用到推荐系统。
但是第一章有个重要的地方就是介绍了推荐系统进行实验的方法有三种，分别是：离线实验、用户调查、在线实验。
**离线实验：**离线实验的方法一般由以下的几个步骤构成：
(1) 通过日志系统获得用户行为数据，并按照一定格式生成一个标准的数据集；
(2) 将数据集按照一定的规则分成训练集和测试集；
(3) 在训练集上训练用户兴趣模型，在测试集上进行预测；
(4) 通过事先定义的离线指标评测算法在测试集上的预测结果。
从上面的步骤可以看到，推荐系统的离线实验都是在数据集上完成的，也就是说它不需要一个实际的系统来供它实验，而只要有一个从实际系统日志中提取的数据集即可。这种实验方法的好处是不需要真实用户参与，可以直接快速地计算出来，从而方便、快速地测试大量不同的算法。
用户调查：字面意思，就是调查一下预测的准确率啊或者满意度这些指标。
在线实验：在完成离线实验和必要的用户调查以后，可以将推荐系统上线做AB测试，将它和旧的算法进行比较。
那什么是AB算法呢？
AB测试：AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组，
并对不同组的用户采用不同的算法，然后通过统计不同组用户的各种不同的评测指标比较不同算法，比如可以统计不同组用户的点击率，通过点击率比较不同算法的性能。
AB测试的优点是可以公平获得不同算法实际在线时的性能指标，包括商业上关注的指标。
AB测试的缺点主要是周期比较长，必须进行长期的实验才能得到可靠的结果。在这里插入图片描述
然后是1.3.2节的评测指标
1、**用户满意度：**用户作为推荐系统的重要参与者，其满意度是评测推荐系统的最重要指标。但是，用户满意度没有办法离线计算，只能通过用户调查或者在线实验获得。
2、**预测准确度：**预测准确度度量一个推荐系统或者推荐算法预测用户行为的能力。这个指标是最重要的推荐系统离线评测指标，从推荐系统诞生的那一天起，几乎99%与推荐相关的论文都在讨论这个指标。
这里有一个评分预测，出现了一个均方根误差（RMSE）和平均绝对误差（MAE）

在这里插入图片描述

对于
测试集中的一个用户u和物品i，令rui是用户u对物品i的实际评分，而ˆrui 是推荐算法给出的预测评分.

接下来就是前言中说贯穿本书的TopN推荐了，主要是用了**准确率（precision）和召回率（recall）**公式如下：

在这里插入图片描述

有的时候，为了全面评测TopN推荐的准确率和召回率，一般会选取不同的推荐列表长度N，计算出一组准确率/召回率，然后画出准确率/召回率曲线（precision/recall curve）。
覆盖率覆盖率（coverage）描述一个推荐系统对物品长尾的发掘能力。

在这里插入图片描述
从上面的定义可以看到，覆盖率是一个内容提供商会关心的指标。
在信息论和经济学中有两个著名的指标可以用来定义覆盖率。第一个是信息熵：

在这里插入图片描述
第二个指标是基尼系数（Gini Index）：

在这里插入图片描述

这里有一个马太效应：，让热门的物品更加热门，不热门的物品更加不热门，那么这个系统就有马太效应。
评测推荐系统是否具有马太效应的简单办法就是使用基尼系数。
如果G1是从初始用户行为中计算出的物品流行度的基尼系数，G2是从推荐列表中计算出的物品流行度的基尼系数，那么如果G2 > G1，就说明推荐算法具有马太效应。
下面介绍了信任度、实时性、健壮性。说一下健壮性吧。
所谓健壮性呢，我感觉像是之前了解的鲁棒性。。众所周知，绝大部分推荐系统都是通过分析用户的行为实现推荐算法的。算法健壮性的评测主要利用模拟攻击。首先，给定一个数据集和一个算法，可以用这个算法
给这个数据集中的用户生成推荐列表。然后，用常用的攻击方法向数据集中注入噪声数据，然后利用算法在注入噪声后的数据集上再次给用户生成推荐列表。最后，通过比较攻击前后推荐列表的相似度评测算法的健壮性。如果攻击后的推荐列表相对于攻击前没有发生大的变化，就说明算法比较健壮。
评测维度呢分为用户维度、物品维度、时间维度

好的第一章ending…大头还是在第二章：利用用户行为数据

你不定积分没加C�

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《推荐系统实践》自己随手写的感想+重点

今天开始读《推荐系统实践》这本书了，所以想先搁浅一下《推荐系统与深度学习》的笔记，一起更吧，哎太懒了。第一章：好的推荐系统略了吧，主要介绍了一些很牛逼的视频网站啊或者其他网站用的推荐系统对他们带来了什么好的影响啊。像是广告啊，音乐啊，视频啊，新闻啊等等，都需要用到推荐系统。但是第一章有个重要的地方就是介绍了推荐系统进行实验的方法有三种，分别是：离线实验、用户调查、在线实验。**离线实验：*...
复制链接

扫一扫