皮尔逊相关系数 余弦相似度

两个向量

 

相似度计算 高中知识计算cos。

 

n维同理 。

越接近1 越相似。

推荐系统中协同过滤 user-item矩阵中某个用户的向量评分假设

A(1,1,2,1,1,1,0,0,0)

B(1,1,1,0,1,1,1,1,1)

相似度为0.81接近1. 挺高。

皮尔逊相关系数:

余弦相似度的问题是: 其计算严格要求"两个向量必须所有维度上都有数值,不可以空。实际中很容易空 用户不评价。这就可以用皮尔逊相关系数,先将null变成0,再将两个向量都先进行中心化。(有人这么说) 。还有说是中心化可以去除量纲影响。

中心化的意思是说, 对每个向量, 我先计算所有元素的平均值avg, 然后向量中每个维度的值都减去这个avg, 得到的这个向量叫做被中心化的向量. 中心化之后所有维度的平均值就是0了,然后再进行我们的余弦计算得到结果。下图的rx即为平均值。

公式如上 

pearson是一个介于-1和1之间的值,当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时,表明它们之间是正相关的,相关系数大于0;如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于0;如果相关系数等于0,表明它们之间不存在线性相关关系。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值