推荐系统之协同过滤collaborative filtering

目录

相似度Similar

计算相似度

根据相似度做预测


相似度Similar

  1. 皮尔森相关系数Person correlation coefficient: 实际上也是一种余弦相似度,不过先对向量做了中心化,向量X和 Y 各自减去向量的均值后,再计算余弦相似度。 r_{xy}=\frac{\sum_{i=1}^{n} (x_{i}-\bar{x})(y_{i}-\bar{y})} {\sqrt{​{\sum_{i=1}^{n} (x_{i}-\bar{x})^{2}}} \sqrt{​{\sum_{i=1}^{n} (y_{i}-\bar{y})^{2}}}}
  2. 余弦相似度:度量两个向量之间的夹角,用夹角的余弦值来表示相似度。
    夹角余弦值相关性
    [0,90)(0,1]正相关
    900不相关
    (90,180][-1,0)负相关

计算相似度

player\games

game1

game2game3game4game5game6game7
A        10298nullnull8
B104null26810
C8null6103null4
Dnullnull48null1010
E68nullnullnull108
F10446

求F和A的皮尔森相关系数

step1:求均值(只计算共同项):\bar{F}=\frac{10+4+4+6}{4}=6    \bar{A}=\frac{10+2+9+8}{4}=7.25

step2:求r:r_{FA}=\frac{(10-6)(10-7.25)+(4-6)(2-7.25)+(4-6)(9-7.25)+(6-6)(8-7.25))} {\sqrt{​{4^{2}+2^{2}+2^{2}+0^{2}}}\sqrt{​{2.75^{2}+5.25^{2}+1.75^{2}+0.75^{2}}}}=\frac{18}{\sqrt{930}}=0.59

同理,依次计算出F和B、F和C、F和D、F和E的相关系数分别为:0.59、0.88、0.65、1、-0.95。

根据相似度做预测

计算预测结果,如求(F,game4):

step1:求出与F正相关的向量(i..m)的均值。\bar{A}=7.4  \bar{B}=6.67  \bar{C}=6.2  \bar{D}=8  \bar{F}=6

step2:根据公式   Prediction=\bar{r}_{F}+\frac{\sum_{i=1}^{m}(r_{i}-\bar{r}_{F})*r_{iF}}{​{\sum_{i=1}^{m}r_{iF}}}      求predicition。

Prediction=6+\frac{(8-7.4)*0.59+(2-6.67)*0.88-(10-6.2)*0.65+(8-8)*1} {0.59+0.88+0.65+1}=6+\frac{-1.286}{3.12}=5.59

结论,由于Predicition=5.59 小于 F的平均值6,所以不推荐game4给F。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值