python 余弦距离_numpy :: 计算特征之间的余弦距离

本文介绍了余弦距离的概念及其在文本相似度、人脸识别和图片检索中的应用。余弦距离与欧式距离的区别在于,余弦距离取值在-1到1之间,而欧式距离通常为正值。通过1-余弦相似度可得到余弦距离。提供了一个用numpy实现的Python函数,可以处理单张和多张图片或文本的余弦距离计算,包括一维向量和二维向量的情况。
摘要由CSDN通过智能技术生成

余弦距离在计算相似度的应用中经常使用,比如:

文本相似度检索

人脸识别检索

相似图片检索

原理简述

下面是

1d94e5903f7936d3c131e040ef2c51b473dd071d

但是,余弦相似度和常用的欧式距离的有所区别。

余弦相似度的取值范围在-1到1之间。完全相同时数值为1,相反反向时为-1,正交或不相关是为0。(如下图,来源)

欧式距离一般为正值,归一化之后在0~1之间。距离越小,越相似。

c8f8f6d00d2888639146aba699837f9a.png

欧式距离用于相似度检索更符合直觉。因此在使用时,需要将余弦相似度转化成类似欧氏距离的余弦距离。

维基页面中给出的

7f02d9676b10bbc362f62ac7ae5be230e876656f

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值