协同过滤算法笔记

本文详细介绍了协同过滤算法,包括基于用户的协同过滤和基于物品的协同过滤。重点阐述了算法的原理、相似度计算以及针对热门物品的惩罚机制。同时,探讨了两种算法的优缺点和实际应用。
摘要由CSDN通过智能技术生成

协同过滤算法笔记

基于邻域的算法是推荐系统中最基本的算法,该算法不仅在学术界得到了深入研究,而且在业界得到了广泛应用,主要是协同过滤算法(collaborative filtering)。协同过滤算法分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法,首先来介绍第一种协同过滤的算法——基于用户的协同过滤(user-based collaborative filtering)


基于用户的协同过滤算法主要包括两个步骤
(1) 找到和目标用户兴趣相似的用户集合。
(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。

步骤(1)的关键就是计算两个用户的兴趣相似度。这里,协同过滤算法主要利用行为的相似度计算兴趣的相似度。给定用户u和用户v,令N(u)表示用户u曾经有过正反馈的物品集合,令N(v)为用户v曾经有过正反馈的物品集合。那么,我们可以通过如下的Jaccard公式简单地计算u和v的兴趣相似度:


或者通过余弦相似度计算:


    

首先建立物品到用户的倒排表,对于每个物品都保存对该物品产生过行为的用户列表。令稀疏矩阵。那么,假设用户u和用户v同时属于倒排表中K个物品对应的用户列表,就有C[u][v]=K。从而,可以扫描倒排表中每个物品对应的用户列表,将用户列表中的两两用户对应的C[u][v]加1,最终就可以得到所

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值