为什么要对差值求平方而不是取标准偏差的绝对值?
我们将x与平均值的差平方为平方,这是因为与自由度的平方根成正比的欧几里德距离(以人口度量,x的数量)是分散的最佳度量。
计算距离
0点到5点的距离是多少?
5−0=55−0=5,
|0−5|=5|0−5|=5和
52−−√=552=5
好的,这很简单,因为它是一个单一维度。
点0、0到点3、4的距离如何?
如果我们一次只能输入一维数据(例如在城市街区中),那么我们只需将数字相加即可。(有时称为曼哈顿距离)。
但是一下子进入二维呢?然后(通过我们在高中都学过的毕达哥拉斯定理),我们对每个维度的距离求平方,对平方求和,然后取平方根求出从原点到点的距离。
32+42−−−−−−√=25−−√=532+42=25=5
从0、0、0点到1、2、2的距离如何?
这只是
12+22+22−−−−−−−−−−√=9–√=312+22+22=9=3
因为前两个x的距离构成了计算最终x的总距离的支路。
x21+x22−−−−−−√2+x23−−−−−−−−−−−−−√=x21+x22+x23−−−−−−−−−−√x12+x222+x32=x12+x22+x32
对于超维空间中的正交测量,我们可以继续扩展对每个维度的距离进行平方的规则,将其推广到所谓的欧几里得距离,如下所示: