学习笔记:基于启发式的协同过滤推荐算法

本文详细介绍了协同过滤推荐算法中的基于用户和项目的方法,包括收集用户偏好、计算相似度(余弦相似、修正余弦和皮尔逊系数)、预测评分以及基于项目的相似性计算。通过实例展示了如何通过这些步骤为用户生成个性化推荐。
摘要由CSDN通过智能技术生成

协同过滤推荐算法可以分为 基于启发式 和 基于模型式 两种。基于启发式的协同过滤算法,又可以分为基于用户的协同过滤算法和基于项目的协同过滤算法。我首先细致学习了基于启发式的协同过滤算法。
启发式协同过滤算法主要包含3个步骤:
1)收集用户偏好信息;
2)寻找相似的商品或者用户;
3)产生推荐。
协同过滤的输入数据集主要是用户评论数据集或者行为数据集。这些数据集主要又分为显性数据和隐性数据两种类型。其中,显性数据主要是用户打分数据,譬如用户对商品的打分,五分制的1分,2分等。隐性数据主要是指用户点击行为、购买行为和搜索行为等,这些数据隐性地揭示了用户对商品的喜好。

一、基于用户的协同过滤
用相似统计的方法得到具有相似爱好或者兴趣的相邻用户,所以称为以用户为基础的协同过滤或基于邻居的协同过滤。
首先,收集用户信息,一般的网站系统使用评分的方式或是给予评价,这种方式被称为“主动评分”。另外一种是“被动评分”,是根据用户的行为模式由系统代替用户完成评价,不需要用户直接打分或输入评价数据。电子商务网站在被动评分的数据获取上有其优势,用户购买的商品记录是相当有用的数据。
然后,构建用户-项目(User/Item)评分矩阵,用Rij表示用户Ui对项目Ij的评分,如果没有评分则Rij=0;
接着,计算最近邻居,假设每一个用户对项目的评分都是一个在n维的空间向量,用计算空间向量的相似度代替计算用户相似性的这样的抽象问题。主要通过下方三种方式来计算用户间的相似度:
1)余弦相似度
余弦相似度主要通过假设在n 维的空间中的评分向量的夹角余弦值来进行计算,将获取用户相似度的目的转换为计算两个不同向量的夹角余弦的值。其中

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值