《Statistical Methods for Recommender Systems》阅读笔记--第二章

经典算法

通常可利用的信息有一下几种:
1)物品的相关信息
2)用户的相关信息
3)用户和物品的交互信息

利用前两种信息的经典算法包括:
1、基于用户人口统计属性的推荐(最近邻推荐)
2、基于内容的推荐

这两种推荐都是需要将用户和物品转换成特征向量表示。
然后基于向量来计算两两之间(用户-用户,物品-物品,用户-物品)相似度来实现推荐。这种在书中,作者称之为无监督方法。
还有一种,虽然转换为特征,但不是计算相似度。而是采用类似逻辑回归这样的模型来预测一个分值。这种称之为有监督方法(需要先采用已有数据训练出一个模型)

利用后一种信息对应的就是协同过滤算法

关于经典算法,感兴趣的可以参考:
1)Adomavicius, G., and Tuzhilin, A. 2005. Toward the next generation of recommender
systems: A survey of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data Engineering, 17, 734–49 (非常经典的综述)
2)Jannach, D., Zanker, M., Felfernig, A., and Friedrich, G. 2010. Recommender Systems:
An Introduction. Cambridge University Press。(中文版已经出版了。名字就是《推荐系统》)
3) Ricci, Francesco, Rokach, Lior, Shapira, Bracha, and Kantor, Paul B. (eds). 2011.
Recommender Systems Handbook. Springer.(中文版(《推荐系统:技术、评估及高效算法 》)

物品描述:
也就是如何构造一个物品特征向量。这个通常因实际的推荐物品不同而不同,对于通常的web(文本)推荐,主要包括以下几种方法:
1)分类;物品属于哪些类别
2)池袋模型(bag of words)
3)主题建模。LDA等
用户描述:
包括两类信息:
1)用户历史偏好物品的内容信息;
2)用户公布的信息。比如人口统计属性、公布的兴趣等。

协同过滤:
协同过滤算法可分为:
1)基于内存的协同过滤算法,有可分为
基于用户的协同过滤和基于物品的协同过滤;
2)基于模型的协同过滤算法。主要包括矩阵分解方面的算法
关于协同过滤,大家可以参考我的另一篇博客:
http://blog.csdn.net/allenalex/article/details/72772916
混合方法:
书中主要讲基于内容和协同过滤这两种经典算法的混合。给出了四种混合的例子:
● 合成(Ensemble)。两种方法单独预测,然后通过线性合并或者某种投票机制合并预测结果。可以参考:
Claypool, Mark, Gokhale, Anuja, Miranda, Tim, Murnikov, Pavel, Netes, Dmitry, and
Sartin, Matthew. 1999. Combining content-based and collaborative filters in an
online newspaper. In Proceedings of ACM SIGIR workshop on recommender systems, vol. 60. ACM.
● 协同过滤的预测结果作为基于特征(内容)的方法的一个特征。
● 在基于相似度的协同过滤总适用基于特征的相似度。
● 人工设定一些基于特征的评分,来增加基于协同过滤的评分数。处理冷启动。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值