Python学习系列文章:👉 目录 👈
一、概述
前面我们提到了 欧式距离,而这里提到的 标准化欧氏距离 (Standardized EuclideanDistance) 是针对 欧式距离 的一种改进。
标准化欧式距离(Standardized EuclideanDistance)主要针对变量 x x x 进行了修改。使其变成了标准化变量。
二、计算公式
数据各维分量的分布不一样,那就先将各个分量都“标准化”到均值、方差等。
假设样本集
X
X
X 的 均值 (mean) 为
m
m
m,标准差 (standard deviation) 为
s
s
s,那么
X
X
X 的 标准化变量 为:
X
∗
=
X
−
m
s
X^*=\frac{X-m}{s}
X∗=sX−m
带入欧式距离公式得: d 12 = ∑ k = 1 n ( x 1 k − x 2 k s k ) 2 d_{12}=\sqrt{\sum_{k=1}^n(\frac{x_{1k}-x_{2k}}{s_{k}})^2} d12=k=1∑n(skx1k−x2k)2
便得到了上面的 标准化欧式距离 公式。