项目第十一条——学习协同过滤算法及关联规则分析与Apriori算法相关知识
- 协同过滤算法的原理:根据用户群体对产品偏好的数据,发现用户之间的相似性或者物品之间的相似性,并基于这些相似性为用户作推荐。
- 基于用户的协同过滤算法(User-based Collaborative Filtering)
其本质是:寻找相似的用户,进而对用户推荐相似用户关注的产品。 - 基于物品的协同过滤算法(Item-based Collaborative Filtering)
其本质是:根据用户的历史偏好信息,将类似的物品推荐给用户。 - 寻找强关联规则的主要步骤:先寻找满足最小支持度的频繁项集,
然后在频繁项集中寻找到满足最小置信度的关联规则。 - 置信度(Confidence):置信度表示在关联规则的先决条件X发生的条件下,关联结果Y发生的概率。
- 提升度(Lift):提升度表示先购买X对Y的概率的提升作用,用来判断规则是否有实际价值,即使用规则后商品在购物车中出现的频率是否高于商品单独出现在购物车中的频率。如果大于1说明规则有效,小于1则无效,等于1则表示X与Y相互独立。