numpy :: 计算特征之间的余弦距离

余弦距离在计算相似度的应用中经常使用,比如:

  • 文本相似度检索
  • 人脸识别检索
  • 相似图片检索

原理简述

下面是余弦相似度的计算公式(图来自wikipedia):

 

但是,余弦相似度和常用的L1距离或欧式距离的有所区别。

  • 余弦相似度的取值范围在-1到1之间。完全相同时数值为1,相反反向时为-1,正交或不相关是为0。(如下图,来源
  • 欧式距离一般为正值,归一化之后在0~1之间。距离越小,越相似。

欧式距离用于相似度检索更符合直觉。因此在使用时,需要将余弦相似度转化成类似于欧氏距离的余弦距离。

维基页面中给出的角距离计算公式如下

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值