先上结论: L2归一化后欧拉距离的平方与cosine相似度的关系为
,
表示向量
和
的欧式距离,
表示向量
和
的cosine相似度。
一、什么是L2归一化(L2 Normalization)?
L2归一化就是对向量的每一个值都除以向量的平方和的开方,如下面的公式,向量
归一化之后得到向量
。归一化之后的向量
中所有值都在
之间,且
。
假设我们有两个向量
和
,长度均为
,它们都已经过L2归一化。
二、欧氏距离(Euclidean Distance)是常见的相似性度量方法,可求两个向量间的距离。
公式1:
三、cosine相似度是一种相似性度量。
公式2:
四、证明:L2归一化后欧拉距离的平方和cosine相似度等价。
由
和
都已归一化,则有
和
让我们开始展开欧氏距离的平方:
由以上证明我们可以得到L2归一化后,
,L2归一化后欧拉距离的平方与cosine相似度等价证毕。