记录推荐领域的一些学习内容和心得
IBM推荐引擎初探
- https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs-
推荐引擎的分类:
- user-based
- 优点:
- 因为不使用当前用户对物品的喜好历史数据,所以对于新用户来讲没有“冷启动(Cold Start)”的问题。
- 这个方法不依赖于物品本身的数据,所以这个方法在不同物品的领域都可以使用,它是领域独立的(domain-independent)。
- 缺点:
- 方法过于粗糙,效果不佳
- 涉及到一些与信息发现问题本身无关却比较敏感的信息,比如用户的年龄等,这些用户信息不是很好获取。
- 优点:
- item-based
- 优点:推荐更加精确
- 缺点:
- 需要对物品进行分析和建模,推荐的质量依赖于对物品模型的完整和全面程度。
- 物品相似度的分析仅仅依赖于物品本身的特征,这里没有考虑人对物品的态度。
- 因为需要基于用户以往的喜好历史做出推荐,所以对于新用户有“冷启动”的问题。
- 协同过滤
- user-based:基于用户的协同过滤推荐机制和基于人口统计学的推荐机制都是计算用户的相似度,并基于“邻居”用户群计算推荐,但它们所不同的是如何计算用户的相似度,基于人口统计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制可是在用户的历史偏好的数据上计算用户的相似度,它的基本假设是,喜欢类似物品的用户可能有相同或者相似的口味和偏好。
- item-based:基于项目的协同过滤推荐和基于内容的推荐其实都是基于物品相似度预测推荐,只是相似度计算的方法不一样,前者是从用户历史的偏好推断,而后者是基于物品本身的属性特征信息。
- 若用户数量大于商品数量,用item-based
- 若商品数量大于用户数量,用user-based
https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html?ca=drs-
- 深入推荐引擎相关算法 - 协同过滤
论文学习
- 8.24-
- 《item-based collaborative filtering recommendation algorithms》
- 123123