推荐系统:推荐算法详解五(CF)

基于协同过滤的推荐算法

协同过滤(Collaborative Filtering,CF)
基于近邻的协同过滤:基于用户(User -CF),基于物品(Item-CF)
基于模型的协同过滤:奇异值分解(SVD),潜在语义分析(LSA),支持向量机(SVM)

与基于内容(CB)对比

基于内容(Content based ,CB)主要利用的是用户评价过的物品的内容特征,而CF还可以利用其他用户评分过的物品内容;
CF可以解决CB的一些局限:
1、物品内容不完全或者难以获得时,依然可以通过其他用户的反馈给出推荐
2、CF基于用户之间对物品的评价质量,避免CB仅依赖内容可能造成的对物品质量判断的干扰
3、CF推荐不受内容限制,只要其他类似用户给出了对不同物品的兴趣,CF就可以给用户推荐出内容差异很大的物品(但有某种内在联系)

基于近邻的推荐

基于近邻的推荐系统根据的是相同‘口碑’准则;

基于用户的协同过滤

在这里插入图片描述
基于用户的协同过滤推荐的基本原理是:根据所有用户对物品的偏好,发现与当前用户口味和偏好相似的邻居用户群,并推荐近邻所偏好的物品;
在一般的应用中是采用计算K-近邻的算法;基于这K个邻居的历史偏好信息为当前用户进行推荐;

User-CF和基于人口统计学的推荐机制:
两者都是计算用户的相似度,并基于相似的邻居用户群计算推荐;
它们所不同的是如何计算用户的相似度:基于人口统计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制是在用户的历史偏好的数据上计算用户的相似度,它的基本假设是,喜欢类似物品的用户可能有相同或者相似的口味和偏好;

基于物品的协同过滤

在这里插入图片描述
基于物品的协同过滤推荐的基本原理与基于用户的类似,只是使用所有用户对物品的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户;
Item-CF和基于内容(CB)的推荐的区别:
其实都是基于物品相似度预测推荐,只是相识度计算的方法不一样,前者是从用户历史的偏好推断,而后者是居于物品本身的属性特征信息;

User-CF 和 Item-CF 的比较

同样是协同过滤,在基于用户和基于物品两个策略中应该如何选择呢?
电商、电影、音乐网站,用户数量远大于物品数量;
新闻网站,物品(新闻文本)数量可能大禹用户数量;
Item-CF应用场景:
基于物品的协同过滤(Item-CF)推荐机制是Amazon在基于用户的机制上改良的一种策略。因为在大部分的Web站点中,物品的数量是远远小于用户的数量的,而且物品的个数和相似度相对比较稳定,同时基于物品的机制比基于用户的实时性更好一些,所以Item-CF可能效果更好;
User-CF应用场景:
设想一下在一些新闻推荐系统中,也许物品(也就是新闻)的个数可能大禹用户的个数,而且新闻的更新程度也很快,所以它的相似度依然不稳定,这时用User-CF可能效果更好
所以,推荐策略的选择其实和具体的应用场景有很多的关系;

基于协同过滤的推荐优缺点

基于协同过滤的推荐机制的优点:
它不需要对物品或者用户进行严格的建模,而且不要求对物品特征的描述是机器可理解的,所以这种方法也是领域无关的;
这种方法计算出来的推荐是开放的,可以共用他人的经验,很好的支持用户发现潜在的兴趣偏好;

存在的问题:
方法的核心是历史数据,所以对新物品和新用户都有‘冷启动’的问题
推荐的效果依赖于用户历史偏好的多少和准确性
在大部分的实现中,用户历史偏好是用稀疏矩阵进行存储的,而稀疏矩阵的计算有些明显的问题,包括坑你少部分人的错误偏好会对推荐的准确度有很大的影响等;
对于一些特殊品味的用户不能给与很好的推荐

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值