全局空间自相关算法:Join Count

原创 2015年11月17日 23:37:22

ArcGIS里面,全局空间自相关只提供了一个Moran's I方法,当然要说一招鲜吃遍天也是可以的,不过关于全局自相关还是有不少其他的方法的,这次给大家介绍一种更加简单并且容易理解的全局空间自相关方法:Join Count方法。

 

这个方法最早是英国剑桥大学的著名地理学家AndrewD. Cliff 教授和美国乔治敦大学的J. Keith Ord提出,就是下面的两位老帅哥:


 

后面这个为J. KeithOrd更是厉害,以前说的 General G 指数也有他的一份。

 

Join Counts这种算法对比那些公式复杂到抓狂的各种算法来说,简单到让人眼前一亮,下面我们来看看他的原理:

 

首先从他的名字上来看,就能够猜出是怎么完的了。这个算法,就是对两个要素之间的连接类型进行计数,然后根据这个计数来判定聚类还是离散的。

 

这种类似一种描述二进制之间关系的方式,如黑/白两种颜色,他们之间的关系就有三种:黑-黑(BB)、白-白(WW)、黑-白(BW)。

如下图:


 

 

三种情况的概率,就如下所示:(有数学恐惧症的同学请略过)


 

算出来之后,他们的预期值是:


 

算出三种值来之后,就可以进行比较了,比较的结果如下:

如果BW比我们所期望的数值要,表示空间自相关。

如果BW比我们所期望的数值要,表示空间自相关。

如果BW比我们所期望的数值均等,表示随机

如下图所示:

 

 

最后,我们来看看分布用我们最属性的Moran's Ijoin Counts两种方法计算出来的全局空间自相关的结果:

 

首先是数据,我们选用2004年美国大选中,小布什的得票率来计算,数据如下图:


 

通过Moran's I方法技术出来的结果如下:


 

 

下面逐条解答一下上面的各项内容:

  • 数据:data数据集里面的小布什得票数
  • 空间权重(空间关系概念化):这里是面数据,用的是共点共边就被认为是近邻,用的是“Queen's Case”(这点看不懂的,请去看白话空间统计之五:空间关系概念化(下)里面的描述)
  • Moran's I统计标准偏差:51.731(统计标准偏差:一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。)
  • p值:2.2e-16,置信度为99%以上,极高置信度区间,说明这份数据效果非常好。
  • alternative hypothesis(备择假设亦称研究假设,统计学的基本概念之一。假设检验中需要证实的有关总体分布的假设,它包含关于总体分布的一切使原假设不成立的命题。):极大
  • Moran's I统计指数:0.5565174275
  • 期望值:-0.0003219575
  • 方差:0.0001158676

 

因为Moran's I的指数是在-1——1之间,越靠近1的,聚集趋势就越明显,所以根据以上数据,我们可以判定,小布什的得票获胜区域(或者失败区域)有明显的聚集趋势,也就是说,如果他在某个区域获胜,那么在旁边的区域也极有可能获胜,反之亦然。

 

下面是通过Join Count方法进行计算的结果:


因为Join Count只能处理二值化数据,所以第一句就是将值化为二值化,布什获胜的,设置为1,失败的设置为0.

结论解读如下:

  • 0:0——失败区域与失败区域关联的计数为130,期望值为54,方差是6.7Z值是29.466
  • 1:1——获胜区域与获胜区域关联的计数为1111,期望值为1030,方差是12.6Z值是22.596
  • 1:0——获胜区域与失败区域关联的计数为311,期望值为472,方差是29.47Z值是-29.645
  • Jtot——不同颜色的计数值计数为311,期望值为472,方差是29.94Z值为-29.413

 

从上面的数据可以看出,BBWW都明显出现了计数值远高于期望值,所以数据呈现聚类模式,其中BB的值方差要小于WW值的方差,所以小布什的获胜选区的聚类程度要略大于失败选区的聚类程度。

 

BW的计数小于期望值,可以认为,不存在离散趋势了。

 

检验统计量表明,BBWW都是正值,说明我们假设的值比较贴合实际运算结果,是一份比较可信的运算过程。

 

最后Jtot是所谓的“不同颜色”也就是说,离散偏随机的计数,可以看见与BW的值非常贴近,所以这份数据也表明了随机的可能也是比较低的。

版权声明:本文为博主原创文章,未经博主允许不得转载。

白话空间统计之:空间自相关

空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副“老...

白话空间统计十六:增量空间自相关

遇上瓶颈……所以进来更新稍微有点慢了……大家见谅 点数据的密度计算,是一个很常用的分析方式,在计算密度的时候,最令人头痛的是如何去确定密度的距离,也就是密度收集区域的半径,那么从这句...

R语言:spdep包(空间数据分析与R语言实践)

摘要: 在空间取样中位置越接近的点相应的变量也可能越相近,这种现象称为空间自相关。空间自相关能够改变人们对某些事物原因的判断。举例来说,一个地点物种数高,临近的点物种数也相应得会高些,但这并不一定是由...

ArcGIS教程:检查空间自相关和方向变化

通过探索数据,您将能够更好地了解测量值之间的空间自相关。这种了解有助于在选择空间预测模型时做出更好的决策。...

白话空间统计之:空间自相关

空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副“老...

白话空间统计之二十五:空间权重矩阵(一)点数据的空间关系(1)

空间分析的根基,来源于60年代Waldo R. Tobler教授“地理学第一定律”的“Tobler's First Law”(简称TFL),即为“Everything is related to ev...

RGB空间的全局直方图均衡化算法

  • 2010年04月15日 13:53
  • 205B
  • 下载

sql的left join和count应用

  • 2014年09月29日 02:31
  • 17KB
  • 下载

scala实战之SparkSQL应用实例(单表count和groupby多来源表join等)

前面几篇博客说了如何读取mysql数据库中的表到DataFrame中以及如何将结果写入到mysql中 今天这个实例主要实现应用sparksql完成用户日志数据的提取并转换成DataFrame(我们将其...

Python 多线程 多进程 全局解释器锁GIL join

Python 代码的执行由Python 虚拟机(也叫解释器主循环)来控制。Python 在设计之初就考虑到要在主循环中,同时只有一个线程在执行,就像单CPU 的系统中运行多个进程那样,内存中可以存放多...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:全局空间自相关算法:Join Count
举报原因:
原因补充:

(最多只允许输入30个字)