推荐系统之基于用户的协调过滤

在海量数据中,推荐系统通过协同过滤技术帮助用户发现兴趣相投的群体,以个性化推荐音乐、商品等。协同过滤包括收集数据、找到相似用户和物品、进行推荐三个步骤。文章介绍了曼哈顿距离、欧几里得距离、皮尔逊相关系数、余弦相似度等用户相似度计算方法,并提供了相关Python实现代码。
摘要由CSDN通过智能技术生成

在如何海量的数据时代,如何从海量的商品中选择相关产品?在1100万首iTunes曲目中,肯定有一部分音乐是你特别喜爱的,那么该如何找到它们呢?
- 专家点评推荐(影评家)
- 通过商品本身寻找(我喜欢披头士的一张专辑,所以会认为他们的另一张专辑也不错)

数据挖掘不仅仅是用来推荐商品,或是单单给商人增加销量,同时也能扩展我们的能力,让我们能够处理海量的数据,如让潘多拉音乐站提供个性化的音乐列表。数据挖掘的重点在于找到数据中的模式。

协调过滤

利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

协调过滤的实现的三步骤:收集数据——找到相似用户和物品——进行推荐


数据集来源:

  1. 用户的浏览记录
  2. 其他浏览过该商品的用户的浏览记录

找到相似用户

这里可以用距离表示,即找到距离最近的两个用户。

计算距离的算法有以下几种:

  1. 曼哈顿距离

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值