推荐系统导论笔记（一）

最新推荐文章于 2020-11-28 07:20:28 发布

dyc941126

最新推荐文章于 2020-11-28 07:20:28 发布

阅读量748

点赞数

分类专栏：推荐系统课程笔记

本文链接：https://blog.csdn.net/dyc941126/article/details/49770973

版权

推荐系统同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

课程笔记

5 篇文章 0 订阅

订阅专栏

推荐算法分类

推荐算法大体可以分为以下几类：

非个性化推荐
基于内容的过滤（Content Based Filtering）
- Information Retrieve
- Knowledge Based
联合过滤（Collaborative Filtering）
- User-User CF
- Item-Item CF
- Dimensionality Reduction

其中非个性化推荐指不涉及到用户属性的推荐，如餐馆推荐，在不考虑用户口味、距离等因素的情况下，可以通过简单的统计给出各个餐馆的Rating，并据此得到推荐的Top N List。当然，要考虑评分作弊、评分的时效性和用户评分习惯等因素。
再比如，超市捆绑销售推荐。如果我们通过统计观测到很多用户买了 $X$ 的同时，买了商品 $Y$ ,那么，我们就可以将 $X$ 和 $Y$ 放在一起进行推荐。
Content Based Filtering是指考虑用户的属性的一种过滤。如某个技术专栏中有Android、大数据、云计算、机器学习等主题的文章，我们可以通过统计用户 $u$ 阅读各个主题的文章数，得出用户属性向量，如 $A_u=[1,5,2,7]$ 。当准备推荐新文章时，我们计算文章属性向量与用户属性向量的夹角的余弦值。越大说明相关性越强，也越应该被推荐。
Collaborative Filtering是指利用其它人/物的Rating来预测缺失的评分。在User-User CF算法中，我们首先计算用户间的相关度（Correlation），然后再根据用户对特定Item的Rating与Correlation加权平均得出缺失的Item的评分。
与之类似，Item-Item CF算法也是利用相似度与评分进行加权得出缺失Item评分的一种方法，不同的是Item-Item CF计算的是Item间的相似度。如我买了商品 $i_1,i_2,i_3$ ，系统计算某个我没买过的商品 $i_4$ 与其他三个商品的相似度，并给出预测评分