参考文档
概念
对点的方向和分布进行分析的一种经典算法——标准差椭圆,用来度量一组数据的方向和分布的,生成的结果会输出一个椭圆。
生成算法
其实算法很简单,要画出一个椭圆,虽然比画圆麻烦点,但是也麻烦不了多少,关键的参数如下:
1、确定圆心。
2、确定旋转角度。
3、确定XY轴的长度。
结果解读
1、椭圆的长半轴表示的是数据分布的方向,短半轴表示的是数据分布的范围,长短半轴的值差距越大(扁率越大),表示数据的方向性越明显。反之,如果长短半轴越接近,表示方向性越不明显。如果长短半轴完全相等,就等于是一个圆了,圆的话就表示没有任何的方向特征。
2、短半轴表示数据分布的范围,短半轴越短,表示数据呈现的向心力越明显;反之,短半轴越长,表示数据的离散程度越大。同样,如果短半轴与长半轴完全相等了,就表示数据没有任何的分布特征。
3、中心点表示了整个数据的中心位置,一般来说,只要数据的变异程度不是很大的话,这个中心点的位置大约与算数平均数的位置基本上是一致的,至于数据变异是什么情况,请看下面第4点。
4、有的同学会很疑惑,为什么你画的这个椭圆,还有很多的点都在外面,没有把所有的点都包含进去?那么就是就是“标准差椭圆”这个名词里面的“标准差”的含义所在了。
在ArcGIS工具里面(其他的工具也都差不多),提供了“椭圆大小”(Ellipse_Size)这个参数,这个参数表示你生成的椭圆的级别,一共有三个,如下表:
三个级别的椭圆,分别表示了你生成的椭圆,能够包含68%,95%和99%三个级别的数据,我们通过可以指定要表示的标准差数(1、2 或 3)来决定你生成的椭圆包含的数据比例。
当要素具有空间正态分布时(即这些要素在中心处最为密集,而在接近外围时会逐渐变得稀疏),第一级标准差(默认值)范围可将约占总数 68% 的输入要素的质心包含在内。第二级标准差范围会将约占总数 95% 的要素包含在内,而第三级标准差范围则会覆盖约占总数 99% 的要素的质心。
所以,当你选择不同标准差等级的时候,你发现你的中心点的位置也可能不同。
当然,作为空间分析工具,方向分布一样可以进行加权计算,这个计算主要还是与中心点的位置确定以及椭圆标准差等级生成的椭圆大小有关系。
案例
一共有两年的伤寒病数据,如下,红色的是2000年的,蓝色是2001年的:
使用1个标准差的结果,生成的椭圆如上,具体数据如下:
我们对关键性的两个指标进行对比:
生成面积表示范围,可以发现2000的伤寒病发病情况的范围要大于2001年的,扁率表示他的方向明确性和向心力的程度,2000年生成的椭圆扁率远高于2001年的,说明了2000的伤寒发病情况,比2001年的方向趋势更明显。
2000年生成的椭圆方向与长江的方向基本相相符,所以2000年的伤寒发病源与长江的关系较为密切。而2001年的发病情况虽然方向性并不如2000年的明显,但是长半轴几乎与长江垂直,可以基本确认,2001年伤寒发病源与长江关系不大,但是呈现向内陆爆发的趋势。