《推荐系统实战 Recommender systems:An introduction》学习笔记(前四章)

(此书基本是综述性的行文,引用了各种论文,读起来太难,所以不太好写正儿八经的读书笔记)

——————————————————————————————

第一章:

一、协同过滤:用户在过去有相同的偏好,那么他们在未来也有相同的偏好。

关键点:1、如何衡量相似度  2、如何处理新用户 3、如何找到相似偏好的用户

二、基于内容的推荐:得到对物品的描述和这些特征的重要记录。

关键点:1、自动获取并改进哟洪湖记录。 2、物品如何匹配用户兴趣  3、如何自动抽取对物品的描述

三、基于知识的推荐:利用额外的人工提供的因果知识生成推荐,适用于无购买记录的单次购买方式。

关键点:1、如何得到知识库? 2、如何处理偏好信息

四、混合推荐方法:适用于克服纯粹协同方法的规模膨胀问题。

关键点:1、如何对方法进行组合?  2、方法的结果权重如何确定

 

第二章:

一、基于用户的最近邻推荐

1、pearson系数 适合基于用户的推荐系统。(对于基于物品的推荐系统,余弦相似度似乎更好)

2、通过k近邻选择与当前用户有正向关联的用户(20~50)个

二、基于物品的最近邻推荐

1、更适用于需要扫描大量潜在近邻,难以做到实时预测与计算。其主要思想是利用物品间的相似度,而不是用户间的相似度(PS:从数学处理看,基于物品的推荐是无视用户的。基于用户的推荐则是主观的)

2、对于物品太多的情况,可以实现准备好一个物品相似度矩阵,如果要求对某个物品的评分,那么对这些近邻物品取加权评分即可。

3、还可以二次采样技术,降低复杂度。

三、关于评分

1、隐式评分和显式评分  2、对于太系数的,使用图来处理。

四、更多的基于模型和预测的方法

1、矩阵因子分解:基于SVD或者主成分分析

2、关联规则:喜欢某几种物品的人也会喜欢另一种物品。

3、支持度:所有交易中同时买两种物品的数量。可信度:所有先买了某种物品所有交易中同时买了两种物品的数量。

4、基于概率分析:使用贝叶斯分类器,将买什么物品转化为多分类问题。这种方法也可以享用k-

means方法对用户进行聚类。

5、贝叶斯分类的优点是噪音点被平均,不相关属性的影响小,不会过拟合。

 

第三章:(本章主要描述基于文本描绘的物品)

1、基于内容推荐系统的工作原理:评估用户还没看到的物品与当前用户过去喜欢的物品的相似度,相似度可以用Dice系数。

2、文档内容使用TF-IDF进行转换。归一化词频=绝对频率/(文档中其他词的)最大频率*反文档频率(降低所有文档中几乎都会出现的关键词的权重)。可以通过停用词、词干等进行改进。

3、基于内容相似度的检索,一大方法也是最近邻(看新文档和喜欢的文档是否相似)。还有Rocchio方法(也是一种线性方法)

4、二分类问题,分类为喜欢与否。可以基于贝叶斯分类,也可以基于SVM和Widrow-hoff算法等。

5、可以用决策树学习和规则归纳法用于电子邮件分类、广告个性化或者采用少量特征集合描述物品集的案例。

6、去除出现太少或者太多的特征。可以使用来观察是否相关。

7、基于内容推荐的缺陷:1、信息的来源taif太复杂,不好抽取分析。2、基于学习的方法会倾向于给出相同的推荐,没有“惊喜度”。

 

第四章:

1、基于知识的推荐可以解决购买数据少、时间跨度大,以及有特别要求的问题。分为基于约束的推荐和基于实例的推荐

2、基于实例的推荐着重于根据不同的相似度衡量方法检索出相似的系统,基于约束的则依赖于明确定义的推荐规则集合。

3、约束问题可以用变量(包括用户属性和产品属性),有限域,约束条件(包括一致性约束,产品约束和过滤条件)描述,即CSP=(V,D,C)

4、如果有空集的话,判断出一个冲突及,然后从中删除一个元素,解决了冲突。可以得到最小集。

.....

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值