机器学习中的数学——距离定义（五）：标准化的欧几里得距离（Standardized Euclidean Distance）

最新推荐文章于 2022-07-13 01:04:33 发布

von Neumann

最新推荐文章于 2022-07-13 01:04:33 发布

阅读量1.9w

点赞数 12

分类专栏：机器学习中的数学文章标签：人工智能机器学习深度学习距离定义欧几里得距离

本文链接：https://blog.csdn.net/hy592070616/article/details/121730738

版权

机器学习中的数学专栏收录该内容

112 篇文章 877 订阅

订阅专栏

我们在《距离定义（一）：欧几里得距离（Euclidean Distance）》中介绍了欧几里得距离，而标准化的欧几里得距离是针对简单欧几里得距离的缺点而作的一种改进方案。

标准化的欧几里得距离的思路：将各个分量都“标准化”到均值、方差相等的区间，即：
$X^*=\frac{X-m}{s}$

其中 $X^*$ 为标准化后的值， $X$ 为原值， $m$ 为分量的均值， $s$ 为分量的标准差。所以 $n$ 维空间中标准化的欧几里得距离为：
$y)=\sqrt{\sum_{i=1}^n(\frac{x_i-y_i}{s_i})^2}$

如果将方差的倒数看成是一个权重，这个公式可以看成是一种加权欧氏距离(Weighted Euclidean Distance)。

下面我们来看一下标准化的欧几里得距离的Python实现：

def StandardizedEuclideanDistance(x, y):
    import numpy as np
    x = np.array(x)
    y = np.array(y)
    
    X = np.vstack([x,y])
    sigma = np.var(X, axis=0, ddof=1)
    return np.sqrt(((x - y) ** 2 /sigma).sum())

上述代码中需要避免某个分量取值一致，即该分量sigma=0。

von Neumann

关注

12
点赞
踩
40

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录