一种计算两个不同样本集相似度的方法:Mahalanobis距离

Mahalanobis距离是由P. C. Mahalanobis提出的,用于衡量两个未知样本集在考虑特征间联系情况下的相似度。与欧氏距离不同,它考虑了特征值的权重,通过样本协方差矩阵进行计算。当协方差矩阵为单位矩阵时,Mahalanobis距离等同于欧氏距离。该方法在处理不同特征权重时具有优势。
摘要由CSDN通过智能技术生成

      由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与传统的欧式距离不同的是它考虑到各种特性之间的联系。

     在n维空间内的两个点x、y(都是n维的向量),它们之间的欧氏距离定义为:对应每维度下差值的平方求和后再求根号1/2,distance = sqrt((x1-x2)(y1-y2)(z1-z2)...)

     其实这里n维空间内的每个点就是一个关于n个特征值的样本,欧氏距离没有考虑到不同特征值之间的权重、影响度,我们需要对不同的特征值x、y、z进行一个权重赋值,下面介绍Mahalanobis距离。

     Mahalanobis距离的计算如下(考虑了不同特征值的对整体距离的影响)

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值