集体智慧编程——协同过滤

本文介绍了协同过滤的基本原理,包括基于用户的协同过滤和基于物品的协同过滤。重点讨论了计算用户相似度的各种方法,如欧几里得距离、皮尔逊相关度、曼哈顿距离、Jaccard系数和余弦相似度,并解释了如何利用这些相似度来推荐物品。此外,还对比了两种协同过滤方法的优缺点。
摘要由CSDN通过智能技术生成

 

目录

1. 基于用户的协同过滤

1.1 相似度评价值

1.1.1 欧几里得距离:

1.1.2 皮尔逊相关度:

1.1.3 曼哈顿距离算法

1.1.4 Jaccard系数

1.1.5 余弦相似度

1.2 推荐物品

2. 基于物品的协同过滤

3. 两种协同过滤比较


1. 基于用户的协同过滤

协同过滤算法通常是对一大群人进行搜索,并从中找出与我们品味想近的一小群人。算法会对这些人所偏爱对其他内容进行考查,并将他们组合起来构造出一个经过排名的推荐列表。 

1.1 相似度评价值

既然要找到品味方面的相似度,就需要将个体与其他人进行比较,并计算他们的相似度评价值;

1.1.1 欧几里得距离:

这个比较简单,采用欧几里得度量方法即可:

d(x,y):={\sqrt  {(x_{1}-y_{1})^{2}+(x_{2}-y_{2})^{2}+\cdots +(x_{n}-y_{n})^{2}}}={\sqrt  {\sum _{​{i=1}}^{n}(x_{i}-y_{i})^{2}}}

1.1.2 皮尔逊相关度:

该相关系统是判断两组数据与某一直线的拟合程度的一种度量。公式较复杂,皮尔逊相关度修正了夸大分值,它在数据不是很规范的情况下会倾向于给出更好的结果,如:影评者对影评的评价总是相对于平均水平偏离很大。

皮尔逊相关度评价算法首先会找出两位评论者都曾评价过的物品,然后计算两者的评分总和与平方和,并求得评分的成绩和。最后算法利用这些计算结果计算出皮尔逊相关系数。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值