在BSA(bulk segregant analysis)的结题报告中,我们经常看到欧几里得距离(Euclidean distance,ED,又称欧氏距离)算法的结果。欧几里得这位大数学家的名字我们都不算陌生,但是欧几里得距离是什么,它又是怎样应用到遗传学研究的领域当中来的呢?
要理解欧几里得距离,我们先要了解欧几里得空间。我们通常所在的空间是三维空间,三维空间任意的点可以被一个三维的坐标定义。而将三维拓展为更高的n维,即得到了n维欧几里得空间。而在n维空间中两个点之间的距离,我们就称之为欧几里得距离。
在具体的应用中,如果一组数据拥有n个相互独立的变量,我们就可以将其置于n维的欧几里得空间中,并应用欧几里得距离来量化两组数据之间的差异。我们都知道,在二维平面上,两点之间的距离计算如下:
那么应用到n维空间中,欧几里得距离的计算也同理,是坐标轴各方向差值的平方和开根号,计算如下: