推荐系统简介

最新推荐文章于 2022-03-09 20:32:30 发布

Yongchun_Zhu

最新推荐文章于 2022-03-09 20:32:30 发布

阅读量643

点赞数

文章标签：推荐系统

好的推荐系统

什么是推荐系统

推荐系统的任务就是联系用户和信息，一方面帮助用户发现对自己有价值的信息，另一方面让信息能够展现在对它感兴趣的用户面前，从而实现信息消费者和信息生产者的双赢。
推荐系统就是自动联系用户和物品的一种工具，它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息，也能将信息推送给对它们感兴趣的用户。

个性化推荐系统的应用

电子商务
电影和视频网站
个性化音乐网络电台
- Pandora背后的音乐推荐算法主要来自于一个叫做音乐基因工程的项目。
- Last.fm记录了所有用户的听歌记录以及用户对歌曲的反馈，在这一基础上计算出不同用户在歌曲上的喜好相似度，从而给用户推荐和他有相似听歌爱好的其他用户喜欢的歌曲。
社交网络
- 利用用户的社交网络信息对用户进行个性化的物品推荐
- 信息流的会话推荐
- 给用户推荐好友
个性化阅读
基于位置的服务
个性化邮件
个性化广告
- 上下文广告：通过分析用户正在浏览的网页内容，投放和网页内容相关的广告。
- 搜索广告：通过分析用户在当前回话中的搜索记录，判断用户的搜索目的，投放和用户目的相关的广告。
- 个性化展示广告：我们经常在很多网站看到大量展示广告，它们是根据用户的兴趣，对不同用户投放不同的展示广告。

推荐系统评测

一个完整的推荐系统一般存在3个参与方（如图1-22所示）：用户、物品提供者和提供推荐系统的网站。因此在评测一个推荐算法时，需要同时考虑三方的利益，一个好的推荐系统是能够令三方共赢的系统。
好的推荐系统不仅仅能够准确预测用户的行为，而且能够扩展用户的视野，帮助用户发现那些他们可能会感兴趣，但却不那么容易发现的东西。同时，推荐系统还要能够帮助商家将那些被埋没在长尾中的好商品介绍给可能会对它们感兴趣的用户。

评测指标

用户满意度（在线指标）
预测准确度（离线指标）：在计算该指标时需要有一个离线的数据集，该数据集包含用户的历史行为记录。然后，将该数据集通过时间分成训练集和测试集。最后，通过在训练集上建立用户的行为和兴趣模型预测用户在测试集上的行为，并计算预测行为和测试集上实际行为的重合度作为预测准确度。
1. 评分预测：评分预测的预测准确度一般通过均方根误差（RMSE）和平均绝对误差（MAE）计算。对于测试集中的一个用户 $u$ 和物品 $i$ ，令 $r_{ui}$ 是用户 $u$ 对物品 $i$ 的实际评分，而 $/hat{r}_{ui}$ 是推荐算法给出的预测评分，那么 RMSE 的定义为：
  $R M S E = \sum u , i \in T ( r u i - r ^ u i ) 2 - - - - - - - - - - - - - - \sqrt | T |$ $RMSE=\frac{\sqrt{\sum_{u,i\in{T}}(r_{ui}-\hat{r}_{ui})^2}}{|T|}$
  MAE采用绝对值计算预测误差，它的定义为：
  $M A E = \sum u , i \in T | r u i - r ^ u i | | T |$ $MAE=\frac{\sum_{u,i\in{T}}|r_{ui}-\hat{r}_{ui}|}{|T|}$
2. TopN推荐网站在提供推荐服务时，一般是给用户一个个性化的推荐列表，这种推荐叫做 TopN 推荐。TopN 推荐的预测准确率一般通过准确率（ precision ） / 召回率（ recall ）度量。
  令 $R(u)$ 是根据用户在训练集上的行为给用户作出的推荐列表，而 $T(u)$ 是用户在测试集上的行为列表。那么，推荐结果的召回率定义为：
  $R e c a l l = \sum u , i \in U | R ( u ) \cap T ( u ) | \sum u \in U | T ( u ) |$ $Recall=\frac{\sum_{u,i\in{U}}|R(u)\cap{T(u)}|}{\sum_{u\in{U}}|T(u)|}$
  推荐结果的准确率定义为:
  $R e c a l l = \sum u , i \in U | R ( u ) \cap T ( u ) | \sum u \in U | R ( u ) |$ $Recall=\frac{\sum_{u,i\in{U}}|R(u)\cap{T(u)}|}{\sum_{u\in{U}}|R(u)|}$
3. 关于评分预测和TopN推荐的讨论
  - 评分预测一直是推荐系统研究的热点，绝大多数推荐系统的研究都是基于用户评分数据的评分预测。
  - 电影推荐的目的是找到用户最有可能感兴趣的电影，而不是预测用户看了电影后会给电影什么样的评分。因此，TopN推荐更符合实际的应用需求。本书主要也是讨论TopN推荐。
覆盖率
1. 覆盖率（coverage）描述一个推荐系统对物品长尾的发掘能力。覆盖率有不同的定义方法，最简单的定义为推荐系统能够推荐出来的物品占总物品集合的比例。假设系统的用户集合为 $U$ ,推荐系统给每个用户推荐一个长度为 $N$ 的物品列表 $R(u)$ 。
  $Coverage=/frac|Uu∈UR(u)||I|$ $Coverage=/frac{|U_{u\in{U}}R(u)|}{|I|}$
2. 其他定义
  在信息论和经济学中有两个著名的指标可以用来定义覆盖率。第一个是信息熵：
  $H = - \sum i = 1 n p (i) l o g p (i)$ $H=-\sum_{i=1}^np(i)logp(i)$
  这里 $p(i)$ 是物品 $i$ 的流行度除以所有物品流行度之和。
  第二个指标是基尼系数(Gini Index):
  $G = 1 n - 1 \sum j = 1 n (2 j - n - 1) p (i j)$ $G=\frac{1}{n-1}\sum_{j=1}^n(2j-n-1)p(i_j)$
  这里， $i_j$ 是按照物品流行度 $p()$ 从小到大排序的物品列表中第 $j$ 个物品。
3. 马太效应：强者更强，弱者更弱效应。
  - 如果一个系统会增大热门物品和非热门物品的流行度差距，让热门的物品更加热门，不热门的物品更加不热门，那么这个系统就有马太效应。
  - 推荐系统的初衷是希望消除马太效应，使得各种物品都能被展示给对它们感兴趣的某一类人群。
  - 如果G1是从初始用户行为中计算出的物品流行度的基尼系数，G2是从推荐列表中计算出的物品流行度的基尼系数，那么如果G2 > G1，就说明推荐算法具有马太效应。
多样性（覆盖用户绝大多数的兴趣点）
1. 多样性描述了推荐列表中物品两两之间的不相似性。因此，多样性和相似性是对应的。假设 $s(i,j)\in{[0,1]}$ 定义了物品 i 和 j 之间的相似度，那么用户 $u$ 的推荐列表 $R(u)$ 的多样性定义如下：
  $D i v e r s i t y = 1 - \sum i , j \in R ( u ) , i \neq j s ( i , j ) 1 2 | R ( u ) | ( | R ( u ) | - 1 )$ $Diversity=1-\frac{\sum_{i,j\in{R(u)},i\neq{j}}s(i,j)}{\frac{1}{2}|R(u)|(|R(u)|-1)}$
  而推荐系统的整体多样性可以定义为所有用户推荐列表多样性的平均值：
  $D i v e r s i t y = 1 | U | \sum u \in U D i v e r s i t y (R (u))$ $Diversity=\frac{1}{|U|}\sum_{u\in{U}}Diversity(R(u))$
2. 从上面的定义可以看到，不同的物品相似度度量函数 $s(i, j)$ 可以定义不同的多样性。如果用内容相似度描述物品间的相似度，我们就可以得到内容多样性函数，如果用协同过滤的相似度函数描述物品间的相似度，就可以得到协同过滤的多样性函数。
新颖性（新颖的推荐是指给用户推荐那些他们以前没有听说过的物品）
惊喜度
- 惊喜度与新颖性的区别：假设一名用户喜欢周星驰的电影，然后我们给他推荐了一部叫做《临歧》的电影（该电影是1983年由刘德华、周星驰、梁朝伟合作演出的，很少有人知道这部有周星驰出演的电影），而该用户不知道这部电影，那么可以说这个推荐具有新颖性。但是，这个推荐并没有惊喜度，因为该用户一旦了解了这个电影的演员，就不会觉得特别奇怪。但如果我们给用户推荐张艺谋导演的《红高粱》，假设这名用户没有看过这部电影，那么他看完这部电影后可能会觉得很奇怪，因为这部电影和他的兴趣一点关系也没有，但如果用户看完电影后觉得这部电影很不错，那么就可以说这个推荐是让用户惊喜的。
信任度
1. 度量推荐系统的信任度只能通过问卷调查的方式，询问用户是否信任推荐系统的推荐结果。
2. 提高信任度的主要方法
  - 增加推荐系统的透明度，而增加推荐系统透明度的主要方法是提供推荐解释。
  - 考虑用户的社交网络信息，利用用户的好友信息给用户做推荐，并且用好友进行推荐解释。
实时性
- 推荐系统需要实时地更新推荐列表来满足用户新的行为变化。
- 推荐系统需要能够将新加入系统的物品推荐给用户。
健壮性
1. 概述：任何一个能带来利益的算法系统都会被人攻击，这方面最典型的例子就是搜索引擎。搜索引擎的作弊和反作弊斗争异常激烈，这是因为如果能让自己的商品成为热门搜索词的第一个搜索果，会带来极大的商业利益。推荐系统目前也遇到了同样的作弊问题，而健壮性（即robust,鲁棒性）指标衡量了一个推荐系统抗击作弊的能力。
2. 提高健壮性
  - 选择健壮性高的算法
  - 设计推荐系统时尽量使用代价比较高的用户行为。比如，如果有用户购买行为和用户浏览行为，那么主要应该使用用户购买行为，因为购买需要付费，所以攻击购买行为的代价远远大于攻击浏览行为。
  - 在使用数据前，进行攻击检测，从而对数据进行清理。
商业目标

评测维度

上一节介绍了很多评测指标，但是在评测系统中还需要考虑评测维度，比如一个推荐算法，虽然整体性能不好，但可能在某种情况下性能比较好，而增加评测维度的目的就是知道一个算法在什么情况下性能最好。这样可以为融合不同推荐算法取得最好的整体性能带来参考。一般来说，评测维度分为如下3种
* 用户维度：主要包括用户的人口统计学信息、活跃度以及是不是新用户等。
* 物品维度：包括物品的属性信息、流行度、平均分以及是不是新加入的物品等。
* 时间维度：包括季节，是工作日还是周末，是白天还是晚上等。

如果能够在推荐系统评测报告中包含不同维度下的系统评测指标，就能帮我们全面地了解推荐系统性能，找到一个看上去比较弱的算法的优势，发现一个看上去比较强的算法的缺点。

Yongchun_Zhu

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
推荐系统简介

好的推荐系统什么是推荐系统推荐系统的任务就是联系用户和信息，一方面帮助用户发现对自己有价值的信息，另一方面让信息能够展现在对它感兴趣的用户面前，从而实现信息消费者和信息生产者的双赢。推荐系统就是自动联系用户和物品的一种工具，它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息，也能将信息推送给对它们感兴趣的用户。个性化推荐系统的应用电子商务电影和视频网站个性化音乐网络电台 Pando
复制链接

扫一扫