白话空间统计十九:热点分析(中)

原创 2015年11月20日 08:39:04

在前面的话:白话空间统计系列还继续更新,因为这段时间在对《使用R语言进行空间统计》系列进行翻译翻译和编写,所以白话空间统计系列和使用R语言进行空间统计可能会交替出现,给大家的阅读带来的不便,请大家谅解(其实虾神想说的心里话是:你们需要的去翻虾神的历史文章,复习一下前面的内容吧!喔呵呵呵呵!)


前文再续,书接上一回。

继续说热点分析与热度图的问题。

最简单的热度图是没有任何属性要求的,一个点,就是一个值,既没有权重,也没有属性约束。但是实际上,每个点代表什么意义,要对那些属性进行分析,这些都是很重要的。

引用毛博士的名言:凡是不考虑属性的空间分析,都是耍流氓……

当然,热度图因为其对信息的描述简洁明了,为广大人民群众喜闻乐见,所以专业领域的“热点分析”就被很多人脑补成了热度图。

不过正如易经里面的“观”卦所言:童观,小人无咎,君子吝。也就是说幼稚的观点,对于庶民百姓,芸芸众生来说是很合理的,因为这种思想符合他们的身份地位。但是对于有志于教化天下的君子来说,还抱持这样幼稚的观点,就是一种耻辱了。

换成同样喜闻乐见的俗话,就是:外行看热闹,内行看门道。

好了情怀问题到此结束,下面还是回到理工科的路子上来。

首先热点分析用的算法,依然是Getis-Ord Gi*,看到这个名词是不是觉得很眼熟啊?没错,就是在高/低值聚类的时候说过的那个Getis-Ord General G算法的局部版本。所以称为Getis-Ord Gi*,也就是美国乔治敦大学麦克多诺商学院(McDonough School of Business)的J. Keith Ord和圣地亚哥州立大学地理系的Arthur Getis,即下面这两位老帅哥提出的:


关于Getis-Ord General G算法的具体描述,大家去看白话空间统计十四章里面的内容。

类比一下全局Moran's I和局部Moran's I的说法,把名称一换,就可以类比出Getis-Ord General G和Getis-Ord Gi*的不同了,如下图(偷懒一下,直接用老图片了):


Getis-Ord Gi*会给你输入的每一个要素一个值,而不是所有的要素给出一个整体值。

因为其与Local Moran's I非常相像,所以我下面将他与Local Moran's I做一个简单的比较:


最后我们来看一个结果(以下结果用R语言编写,脚本和数据在下期放出)


这是2004年美国大选,对各县区对小布什的投票数进行的热点分析,可以看见最高热的区域就是德克萨斯州……这也是老布什和小布什两代总统的家乡,小布什在当选总统之前,于1995年-2000在德州当了5年的州长,必须的老根据地。

还有一个很有意思的地方,就是有钱人多的地方,对小布什的投票都是低值聚类,比如加州,比如纽约……小布什同学当选,难道就是传说中的“得屌丝者得天下”么?

好吧,关于美国选举格局的解读,我们这些技术宅的并不在行。不过最后要强调的一点还是,热点图和热度图完全不相干……如果用热度图的方式来解读这张图的话,小布什怎么可能当选?大家说是吧。

待续未完

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

白话空间统计十九:热点分析(下):结果解读以及用R语言实现

热点和获胜(选票的多少)是没有任何关系的,唯一的关系,就是热点区域表示没有杂质的获胜。用通俗的话来说,就是:在这个区域内,只要任何一个区域获胜,那么就可以推定,周边的区域一样会获胜。同理,冷区也是如此...

白话空间统计十九:热点分析(上)

通过得到的 z 得分和 p 值,我们可以知道高值或低值要素在空间上发生聚类的位置。但是这个工具的工作方式有些特殊:它查看邻近要素环境中的每一个要素。高值要素往往容易引起注意,但可能不是具有显著统计学意...

白话空间统计之十:标准距离

标准距离在空间统计里面也是一个常用的方法,因为它可提供有关中心周围要素分布的单一汇总度量值(此方法类似于通过标准差测量统计平均值周围数据值的分布)。...

白话空间统计之:空间自相关

空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副“老...

白话空间统计之四:P值和Z值(上):零假设

本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等全部说完在讲操作吧,否则操作出来的结果会发现大量的“不明觉厉”。     首先是空间统计里面很神秘的两个值:P值和Z...

白话空间统计之六:平均最近邻

平均最近邻可以得出一份数据的具体聚集程度的指数,通过这个指数,可以对比不同数据中,哪个数据的聚集程度最大。适用于对固定研究区域中不同的要素进行比较。比如在同一城市范围内,不同类型的企业之间的分布情况的...

白话空间统计番外四:轨迹特征分析实例 2016年9月9日 12:44

前面的话:        本文是近期对空间聚类和特征分析研究的总结性文档之一,有对这些算法有兴趣的同学,可以与我联系,另外如果有同学做毕业论文想做相关思路的,也可以与我联系,我可以以企业导师的身份进...

白话空间统计之五:空间关系的概念化(上)

空间统计分析与传统的统计分析,最大的区别就在于空间统计学把空间信息和空间关系都直接整合到了算法之中。如果取消掉空间相关的特性,空间统计学与传统统计学就没有多大的区别了。   因此在做空间统计时,都要求...

白话空间统计十八:相关性分析

其实这一章开始想放到了番外篇里面。因为相关性分析是经典统计学里面最基础也是最重要的分析方法之一。题目还是取了个白话空间统计,所以总是有点怪怪的。   不过空间统计要是完全脱离经典统计学去谈,那就真...

白话空间统计二十三:回归分析(二)

前缘再续,书接上一回…… 要理解回归分析的这些特点(优点)以及特性,首先得了解一下回归分析的一些概念。 所谓“信息从来是一切的基础,世界上从不存在建立在空中楼阁上的智慧,搜集、处理信息本身...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:白话空间统计十九:热点分析(中)
举报原因:
原因补充:

(最多只允许输入30个字)