白话空间统计二十四:地理加权回归(一)

原创 2017年03月02日 09:23:17

二十四在人的生活中有举足轻重的地位,一年有二十四个节气,一天有二十四个小时。中国的正史称之为“二十四史”(有人说加清史就二十五了……但是正史这个词,出自清乾隆钦定二十四史,所以一直“正史”这个词,专指二十四史),白话空间统计写到现在,历时18个月,终于写到这个一元复始的二十四章了。

地理加权的回归分析是空间统计里面一个重要关口……如果说莫兰指数作为空间统计的入门门槛,P值Z得分是空间统计第一个拦路虎,那么地理加权回归分析,就应该是飞升的天劫了……渡得过去,就霞举飞升,天地同寿……渡不过去,就魂飞魄散……额,也没那么恐怖,过不去就过不去了,大不了我不当神仙了就是。

上一节说到,当数据缺失的时候,可以通过回归方程进行补全,通过两个数据示例我们发现,全局的回归方程会出现各种问题,而局部的回归,效果往往更好。说到这里的时候,我们来看下面的数据:

山东省分市区的人口与财政收入数据(2015年,数据来源山东省统计信息网),中国有句老话,叫做“人多力量大”,当然,也有个别想当一秒钟英雄的不甚认同这句话,比如下面:


但是一般来说,在我们的印象中,人口的多少与财政收入也往往是正相关的。


那么我们首先来进行一下全局的一元回归,看看结果:


以前漏掉回归概念的科普:R-squared,也就是判定系数,这个系数在0-1之间,越接近1,表示这回归模型的效果越好,比如判定系数为1的话,就表示模型中的自变量能够100%的解释因变量的变化……类推,上面的0.04,就表示在这个模型里面,自变量只能解释4%的因变量的变化……换句话说,这两个东东基本上就没有啥关系嘛。

但是,我抽取一个市的数据,比如威海,然后再计算一下,如下所示:



这一刻,我的心情是:


如果说,这是虾神刻意提出来的一些数据,还情有可原……但是这不是一个完整的市么?肯定是幻觉……我们来换一个城市……嗯,就换成虾神最喜欢的格陵兰——greenland……当然,你叫它青岛也行……



当一个数据,在A区域内有很强的解释能力,比如在威海市,人口数量对财政收入的变化,可解释性超过了96%,但是同样居于鲁东的青岛,只有1%,简直就不能用不显著来形容。这种在不同区域具有不同性质的情况,就是在空间分析里面无所不在的空间异质性了……

如何能够避免这个问题呢?那么地理加权的回归分析,就是为了对这个问题进行修正而生。

正如虾神所言:
天若不生GWR,万古回归如长夜……


至于这个神器如何使用,如何解读,我们下回分解……

版权声明:本文为博主原创文章,未经博主允许不得转载。

白话空间统计二十四:地理加权回归(四)

本来这一章准备直接写(照抄)ArcGIS的帮助文档,写地理加权回归工具的使用……,然后就直接结束地理加权回归的,但是近来收到不少同学的邮件,很多都是掉在了当年虾神挖出的大坑里面,比如写了方法,没有列出...
  • allenlu2008
  • allenlu2008
  • 2017年03月19日 17:56
  • 5256

白话空间统计二十四:地理加权回归(二)

六千多字的大篇……诚意满满啊…… 橘生淮南则为橘,生于淮北则为枳,叶徒相似,其实味不同。所以然者何?水土异也。——《晏子春秋·内篇杂下》 水土不服、南北差异,(包括地域歧视)是自古以来的一个大命题...
  • allenlu2008
  • allenlu2008
  • 2017年03月05日 19:29
  • 4820

白话空间统计二十四:地理加权回归(八)结果解读(一)

地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的: 这种图里面数值和颜色,主要是系数的标准误差。主要用来衡量每个系数估计值的可靠性。标准误差与实际系数值相比...
  • allenlu2008
  • allenlu2008
  • 2017年06月05日 20:21
  • 2598

白话空间统计二十四:地理加权回归(三)

本章有数学公式……对数学过敏者慎入…… 前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学...
  • allenlu2008
  • allenlu2008
  • 2017年03月12日 18:49
  • 3803

白话空间统计二十四:地理加权回归(五)

这是写概念的最后一节……从下一节开始,大家就可以告别枯燥的理论和概念了(此次应有掌声) 上一章节写到,地理加权中,空间关系的比广义的空间关系的限制要多得多,常用的就是用距离衰减的方法,而这种方法最常...
  • allenlu2008
  • allenlu2008
  • 2017年04月06日 13:16
  • 5189

白话空间统计二十四:地理加权回归(九)结果解读(二)

实际上,除了辅助表以外,GWR还会生成一份全要素的表。对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容。 生成的新的要素类字段信息如下: 实际上,Coeffc...
  • allenlu2008
  • allenlu2008
  • 2017年06月06日 16:35
  • 2076

白话空间统计二十四:地理加权回归(五)

这是写概念的最后一节……从下一节开始,大家就可以告别枯燥的理论和概念了(此次应有掌声) 上一章节写到,地理加权中,空间关系的比广义的空间关系的限制要多得多,常用的就是用距离衰减的方法,而这种方法最常...
  • allenlu2008
  • allenlu2008
  • 2017年04月06日 13:16
  • 5189

白话空间统计二十四:地理加权回归(十)完结篇

地理加权回归写到这一章,一共是十章了,实际上从回归分析开始,写回归相关的博客一共写了接近20章(其中回归分析五章,番外四章,加上地理回归十章(包括这一篇))。 这一章名为完结篇,实际上应该在标题...
  • allenlu2008
  • allenlu2008
  • 2017年07月03日 18:24
  • 1540

白话空间统计二十四:地理加权回归(九)结果解读(二)

实际上,除了辅助表以外,GWR还会生成一份全要素的表。对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容。 生成的新的要素类字段信息如下: 实际上,Coeffc...
  • allenlu2008
  • allenlu2008
  • 2017年06月06日 16:35
  • 2076

白话空间统计二十四:地理加权回归(三)

本章有数学公式……对数学过敏者慎入…… 前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学...
  • allenlu2008
  • allenlu2008
  • 2017年03月12日 18:49
  • 3803
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:白话空间统计二十四:地理加权回归(一)
举报原因:
原因补充:

(最多只允许输入30个字)