点数据集描述性空间统计之六——方向分布统计(标准差椭圆)(Standard DeviationalEllipse)原理及python实现
1.原理
在上一篇圆概率误差统计中(详见:【空间分析之五】点数据集圆概率误差统计CEP(Circle Error Probable ) - ganquan78的博客 - CSDN博客),我们实现了对点数据集点X坐标、Y坐标以及距离的标准差计算,求出了以平均中心为圆心,CEP为半径的概率误差圆。这种统计方法简单易行,但是其缺陷在于,无法统计出点数据的方向趋势。在真实的地理环境下,点数据集的方向分布往往跟真实地理实体的走向具有相关性,比如某种流行病的分布方向与附近的河流走向紧密相关,又比如某种类型的犯罪事件分布方向与某条街道走向紧密相关,等等。这些方向特性可以通过对点数据的方向分布统计来计算。
通过测量平差等理论知识我们知道,点数据的距离标准差:
δ d = δ x 2 + δ y 2 \delta_d=\sqrt{\delta_x^2+\delta_y^2} δd=δx2+δy2
具有与坐标系统无关的特性,即无论坐标轴如何旋转,距离标准差始终保持不变,无法反应出在每个方位的标准差。
因此,可以通过定义一个标准差椭圆,来描述点数据集分布方向。描述标准差椭圆需要如下几个参数
1.椭圆的中心:为点数据集的平均中心。
2.椭圆的X轴的方向角(以正北为0度,顺时针旋转到X轴的角度):
3.椭圆的长半轴的长度。坐标旋转后,点数据集在X轴的标准差大小,是所有方向标准差的最大值;
4.椭圆的短半轴的长度。坐标旋转后,点数据集在Y轴的标准差大小,是所有方向标准差的最小值。
2.计算公式
1)计算点数据集的平均中心,根据【空间分析之一】点数据集平均中心统计(Mean Center) - ganquan78的博客 - CSDN博客
可以求出点数据集的平均中心的X坐标和Y坐标:
X ‾ 和 Y ‾ \overline{X}和 \overline{Y} X和Y
2)计算椭圆长轴方向角。
θ = a t a n ( A + B C ) \theta=atan (\dfrac{A+B}{C}) θ=atan(CA+B)
A = ∑ i = 1 N ( x i − X ‾ ) 2 − ∑ i = 1 N ( y i − Y ‾ ) 2 A=\sum_{i=1}^{N}(x_i- \overline{X})^2-\sum_{i=1}^{N}(y_i- \overline{Y})^2