余弦距离在计算相似度的应用中经常使用,比如:
文本相似度检索
人脸识别检索
相似图片检索
原理简述
下面是
但是,余弦相似度和常用的欧式距离的有所区别。
余弦相似度的取值范围在-1到1之间。完全相同时数值为1,相反反向时为-1,正交或不相关是为0。(如下图,来源)
欧式距离一般为正值,归一化之后在0~1之间。距离越小,越相似。
欧式距离用于相似度检索更符合直觉。因此在使用时,需要将余弦相似度转化成类似欧氏距离的余弦距离。
维基页面中给出的
余弦距离在计算相似度的应用中经常使用,比如:
文本相似度检索
人脸识别检索
相似图片检索
原理简述
下面是
但是,余弦相似度和常用的欧式距离的有所区别。
余弦相似度的取值范围在-1到1之间。完全相同时数值为1,相反反向时为-1,正交或不相关是为0。(如下图,来源)
欧式距离一般为正值,归一化之后在0~1之间。距离越小,越相似。
欧式距离用于相似度检索更符合直觉。因此在使用时,需要将余弦相似度转化成类似欧氏距离的余弦距离。
维基页面中给出的