基于近邻推荐方法综述---《推荐系统技术、评估及高效算法》---读书笔记(4)

一、组织目录图(单击图放大)

二、补充笔记

1、协同过滤的方法可以分为两类,一种为基于近邻的方法,一种为基于模型的方法。

2、基于近邻的方法可以分为基于用户的方法和基于物品的方法。基于用户的方法为了评估用户u对物品i的感兴趣程度,可以利用和用户u相似的用户v对物品i的评价来预测。基于物品的方法,是基于用户u给相似于i的物品的评分来预测用户u对物品i的评分。

3、注意协同过滤中的基于近邻中的基于物品的方法和基于内容的推荐方法是不同的。基于内容的推荐方法通过用户已经评分的物品来确定这些物品的共同特点(特征抽取),并利用这些特点为用户推荐具有这些特点的新物品。而近邻方法的基于物品的方法没有特征抽取这个步骤,通过寻找物品i和物品j在用户中的相似度。举个例子,在基于内容的方法中要判断物品i和物品j相似,就必须采取特征抽取去评判,而在基于内容的协同过滤,只要很多用户喜欢物品i的同时也喜欢物品j,则表明物品i和物品j相似。

4、为了预测用户u对物品i的评分R(u,i),可以采用分类和回归的方法,如果评分是一些离散的值,分类更加合适,而如果评分是连续的值的话,回归更加合适。

5、如果系统中用户的数量远大于物品的数量,那么使用基于物品的推荐算法有助于节省运算资源。对于用户数量小于物品数量的系统,使用基于用户的推荐算法有助于节省运算资源。

6、基于用户的推荐系统,能够带给用户更加新颖的选择,增加用户的惊喜度。

7、标准化中,Z-score标准化更有优势,当然还可以使用基于偏好的过滤方法来进行标准化。

8、覆盖受限的问题:与用户相似度不高的用户,并不代表和用户没用相同的爱好,并且只有被近邻评价的商品才会被推荐,推荐方法的覆盖受限。

9、对稀疏数据的敏感问题,又称为冷启动问题,对于新加入的用户,因为评分过少,近邻过少,就会导致偏差。解决这类问题使用默认的数据去填补缺失的分数,缺失的评分也可以使用filterbots的组件去填充。当然通过降维和图方法也可以一定程度的解决。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值