余弦相似度

余弦相似度是推荐系统中用于衡量内容或物品相似度的一种算法,通过计算两个向量夹角的余弦值来确定相似度。在n维向量空间中,该方法同样适用。在 Movielens 系统中,可以采用两种方法计算用户之间的余弦相似度,分别是基于物品集合的绝对值和基于用户喜好向量的方法。
摘要由CSDN通过智能技术生成

在推荐系统中,对于文章内容和物品相似度有多种算法可以使用,而余弦相似度算法相对简单并且准确性也不错,因此使用率比较高。

定义: 余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。

通过计算两个向量之间的夹角来衡量两个向量的相似度,角度越小说明相似度越高。
在这里插入图片描述

在向量表示的三角形中,假设a向量是(x1, y1),b向量是(x2, y2),那么可以将余弦定理改写成下面的形式:

在这里插入图片描述

向量a和向量b的夹角 的余弦计算如下:
在这里插入图片描述

如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值