推荐系统——2.2相似度衡量

本文深入探讨了相似度衡量方法,重点讲解了皮尔逊相关系数(PCC)和贝叶斯相似度。PCC用于衡量用户行为差异性,但在某些情况下需要改进,如处理评分稀疏性和分母为0的问题。而贝叶斯相似度考虑了评分向量的方向和长度,更适合处理数据稀疏问题。
摘要由CSDN通过智能技术生成

本节内容提要

在上节中,我们接触到不少相似度衡量(Similarity Measures)的方法,例如皮尔逊相关系数(PCC)、从向量夹角演化出的Cosine相似度、运用贝叶斯理论获得的概论计算公式。

在本节中,我们对相似度相关的算法和理论做一个系统而全面的梳理。

  1. 常用的相似度衡量方法
    • Pearson Correlation Coefficient(PCC)
    • Cosine Similarity(COS)
  2. 相关性分析
  3. 一些其他的相似度衡量方法
    • Distance-based Similarities
    • Set-based Similarities)
    • Link-based Similarities
    • Bayesian Similarity

皮尔逊相关系数(Pearson Correlation Coefficient/PCC)

皮尔逊相关系数公式

公式如下图,其中, a a a b b b是待比较的两个用户, r a , p r_{a,p} ra,p是用户 a a a对项目 p p p的评分,集合 P P P是用户 a a a和用户 b b b共同评分过的产品集, r a ˉ \bar{r_a} raˉ是用户 a a a P P

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值