“统计距离”,主要是用于区别常用的欧式距离,或直线距离。 欧式距离在计算方法和理解上较为简单,但在一些统计问题上还是有一些缺点。比如,在欧式距离中,每个坐标的贡献是同等的,但用测量值做为坐标值计算距离时,会带有不等的随机波动,这种情况下需要对坐标进行加权。
还有一点就是,数据分量为不同的量时,欧式距离的大小与分量所使用的单位相关。
因此,统计距离在欧式距离的基础上,采用合理权数,旋转变换的方法,得到能够提现分量的变差,但又与分量单位无关的合理距离。
d(P,Q) = []
马氏距离是教常用的一种统计距离:
利用坐标差平方除以方差跑【多维时除以协方差矩阵】。