余弦距离在计算相似度的应用中经常使用,比如: 文本相似度检索 人脸识别检索 相似图片检索 原理简述 下面是余弦相似度的计算公式(图来自wikipedia): 但是,余弦相似度和常用的L1距离或欧式距离的有所区别。 余弦相似度的取值范围在-1到1之间。完全相同时数值为1,相反反向时为-1,正交或不相关是为0。(如下图,来源) 欧式距离一般为正值,归一化之后在0~1之间。距离越小,越相似。 欧式距离用于相似度检索更符合直觉。因此在使用时,需要将余弦相似度转化成类似于欧氏距离的余弦距离。 维基页面中给出的角距离计算公式如下