《文哥的学习笔记——推荐系统实战》笔记

发现了大神的学习笔记文哥的学习笔记。简单记录下知识点。
第一篇
1、评测指标:满意度,准确度,覆盖率,多样性,新颖性,惊喜度,信任度,实时性,健壮性,商业目标。
第二篇:
1、基于邻域的方法包括基于用户的协同过滤算法,基于物品的协同过滤算法
2、新闻网站一般使用UserCF,而图书、电商网站一般使用ItemCF
3、UserCF给用户推荐那些和他有共同兴 趣爱好的用户喜欢的物品,而ItemCF给用户推荐那些和他之前喜欢的物品类似的物品。UserCF的推荐更社会化,反映了用户所在的小型兴趣群体中物品的热门程度,而ItemCF的推荐更加个性化,反映了用户自己的兴趣传承。另外,选用哪种方法也和网站自身属性有关,拥有的客户和商品属性有关,比如客户数量更多,或商品更新速度缓慢。
4、基于图的推荐。度量用户顶点 vu和与vu没有边直接相连的物品节点在图上的相关性。
第三篇 冷启动:
1、用户冷启动,系统冷启动,物品冷启动
2、解决方法:
1)提供非个性化的推荐,非个性化推荐的最简单例子就是热门排行榜。
2)利用用户注册时提供的年龄、性别等数据做粗粒度的个性化。
3)利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品。
4)要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品。
5)对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
6)在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。
第四篇 利用标签数据推荐:
1、UGC(User Generated Content,用 户生成的内容):让普通用户给物品打标签
2、新用户数据比较少时,可以进行标签扩充,比如使用相似标签
3、标签清理
标签需要清理主要有两个原因:
1)不是所有标签都能反应用户的兴趣
2)标签清理的另一个重要意义在于将标签作为推荐解释
标签清理的主要方法有:
1)去除词频很高的停止词
2)去除因词根不同造成的同义词
3)去除因分隔符造成的同义词
第五篇 利用上下文信息进行推荐:
1、上下文包括用户访问推荐系统的时间、地点、心情等时间上下文,地点上下文,
2、推荐算法需要平衡考虑用户的近期行为和长期行为
3、时间多样性包括:在用户有了新的行为后及时调整推荐结果,在用户没有新的行为时也能够经常变化一下结果(比如每天给用户进行推荐时,对他前几天看到过很多次的推荐结果进行适当地降权)
4、时间上下文相关的ItemCF,时间上下文相关的UserCF
5、路径融合算法
第六篇 利用社交网络数据进行推荐:
1、有3种不同的社交网络数据:双向确认的社交网络数据,一般通过无向图表示;单向关注的社交网络数据:用户关系是单向的,可以通过有向图表示;基于社区的社交网络数据:比如豆瓣小组
2、社会化推荐有时候也有一定的缺点,主要是不一定提高推荐算法的离线精度,因为社交网络中好友关系不是基于共同兴趣产生的,所以用户好友的兴趣往往和用户的兴趣不一致
3、优点:好友推荐可以增加推荐的信任度;社交网络可以解决冷启动问题
4、在推荐 算法中考虑好友和用户的熟悉程度以及兴趣相似度
5、熟悉度可以用用户之间的共同好友比例来度量,兴趣相似度可以通过和UserCF类似的方法度量
6、基于图的社会化推荐算法,定义图中顶点、边和边的权重
第七篇 评分预测问题:
1、SVD,Simon Funk的SVD分解
2、SVD分解为三个矩阵,Simon Funk的SVD分解为两个低秩的用户和物品矩阵。矩阵不是方阵,即列数和行数不等,也可以分解,最常用的分解方法是奇异值分解
3、SVD分解:需要先补全稀疏评分矩阵,计算复杂度很高
4、LFM加入偏置项分离某些全局影响。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值