欧几里得最短距离公式_标准化欧氏距离(Standardized Euclidean distance )

标准化欧氏距离是对简单欧氏距离的改进,通过将数据各维分量均值归一化到0,方差归一化到1来消除分布差异。公式为:(标准化前的值 - 均值) / 标准差。在Matlab中,使用pdist函数可以计算两向量间标准化欧氏距离,但在实际应用中可能遇到与理论值不一致的情况,需要理解标准差的计算方式。
摘要由CSDN通过智能技术生成

标准欧氏距离的定义

标准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。

标准欧氏距离的思路:既然数据各维分量的分布不一样,好吧!那我先将各个分量都“标准化”到均值、方差相等吧。

均值和方差标准化到多少呢?

这里先复习点统计学知识吧,假设样本集X的均值(mean)为m,标准差(standarddeviation)为s,那么X的“标准化变量”表示为:​

而且标准化变量的数学期望为0,方差为1。

因此样本集的标准化过程(standardization)用公式描述就是:​

标准化后的值 =  (

标准化前的值  - 分量的均值 ) /分量的标准差

经过简单的推导就可以得到两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的标准化欧氏距离的公式:​

如果将方差的倒数看成是一个权重,这个公式可以看成是一种加权欧氏距离(WeightedEuclidean

distance)。​

(2)Matlab计算标准化欧氏距离

例子:计算向量(0,0)、(1,0)、(0,2)两两间的标准化欧氏距离

(假设两个分量的标准差分别为0.5和1)

X= [0 0 ; 1 0 ; 0 2]

D= pdist(X, 'seuclidean',[0.5,1])

结果:

D=

2.0000   2.0000

2.8

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值