《Statistical Methods for Recommender Systems》阅读笔记--第二章

最新推荐文章于 2018-03-03 10:17:21 发布

aturbofly

最新推荐文章于 2018-03-03 10:17:21 发布

阅读量657

点赞数

分类专栏：推荐系统

本文链接：https://blog.csdn.net/Allenalex/article/details/79120275

版权

推荐系统专栏收录该内容

21 篇文章 4 订阅

订阅专栏

经典算法

通常可利用的信息有一下几种：
1)物品的相关信息
2)用户的相关信息
3）用户和物品的交互信息

利用前两种信息的经典算法包括：
1、基于用户人口统计属性的推荐（最近邻推荐)
2、基于内容的推荐

这两种推荐都是需要将用户和物品转换成特征向量表示。
然后基于向量来计算两两之间（用户-用户，物品-物品，用户-物品）相似度来实现推荐。这种在书中，作者称之为无监督方法。
还有一种，虽然转换为特征，但不是计算相似度。而是采用类似逻辑回归这样的模型来预测一个分值。这种称之为有监督方法（需要先采用已有数据训练出一个模型）

利用后一种信息对应的就是协同过滤算法

关于经典算法，感兴趣的可以参考：
1）Adomavicius, G., and Tuzhilin, A. 2005. Toward the next generation of recommender
systems: A survey of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data Engineering, 17, 734–49 （非常经典的综述）
2）Jannach, D., Zanker, M., Felfernig, A., and Friedrich, G. 2010. Recommender Systems:
An Introduction. Cambridge University Press。（中文版已经出版了。名字就是《推荐系统》）
3) Ricci, Francesco, Rokach, Lior, Shapira, Bracha, and Kantor, Paul B. (eds). 2011.
Recommender Systems Handbook. Springer.(中文版（《推荐系统:技术、评估及高效算法》）

物品描述：
也就是如何构造一个物品特征向量。这个通常因实际的推荐物品不同而不同，对于通常的web(文本)推荐，主要包括以下几种方法：
1)分类；物品属于哪些类别
2）池袋模型（bag of words）
3）主题建模。LDA等
用户描述：
包括两类信息：
1）用户历史偏好物品的内容信息；
2）用户公布的信息。比如人口统计属性、公布的兴趣等。

协同过滤：
协同过滤算法可分为：
1）基于内存的协同过滤算法，有可分为
基于用户的协同过滤和基于物品的协同过滤；
2）基于模型的协同过滤算法。主要包括矩阵分解方面的算法
关于协同过滤，大家可以参考我的另一篇博客：
http://blog.csdn.net/allenalex/article/details/72772916
混合方法：
书中主要讲基于内容和协同过滤这两种经典算法的混合。给出了四种混合的例子：
● 合成（Ensemble）。两种方法单独预测，然后通过线性合并或者某种投票机制合并预测结果。可以参考：
Claypool, Mark, Gokhale, Anuja, Miranda, Tim, Murnikov, Pavel, Netes, Dmitry, and
Sartin, Matthew. 1999. Combining content-based and collaborative filters in an
online newspaper. In Proceedings of ACM SIGIR workshop on recommender systems, vol. 60. ACM.
● 协同过滤的预测结果作为基于特征（内容）的方法的一个特征。
● 在基于相似度的协同过滤总适用基于特征的相似度。
● 人工设定一些基于特征的评分，来增加基于协同过滤的评分数。处理冷启动。

aturbofly

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《Statistical Methods for Recommender Systems》阅读笔记--第二章

经典算法通常可利用的信息有一下几种： 1)物品的相关信息 2)用户的相关信息 3）用户和物品的交互信息利用前两种信息的经典算法包括： 1、基于用户人口统计属性的推荐（最近邻推荐) 2、基于内容的推荐这两种推荐都是需要将用户和物品转换成特征向量表示。然后基于向量来计算两两之间（用户-用户，物品-物品，用户-物品）相似度来实现推荐。这种在书中，作者称之为无监督方
复制链接

扫一扫