在毕业论文写作之余,为大家带来一篇干货文章。通常我们在做空间计量模型的时候,最常用的应该是Geoda(然而我并不会用),但又想学习一下怎么办?Pysal帮我们解决了这个大问题,Pysal集成了众多空间分析与空间计量的功能,十分强大,其中的子模块spreg即可实现众多的空间计量模型,对于空间计量经济学方面的理论我一无所知,因此本篇文章是从GIS及数据分析角度出发的,如果有错误的话,还请各位老师同学多多指出,欢迎私信公众号后台与我交流。
正常针对数据建模的话,我们最常用的便是基于最小二乘OLS的多重线性回归。多重线性回归假设样本之间都是相互独立的。而对于空间数据,这一假设常常是不成立的。举个例子,如果我想研究网约车出行量与POI数量之间的关系,把交通小区内网约车出行量设置为y,把各类POI个数设置为x,然后做OLS回归,其实这时我们默认了交通小区之间都是相互独立的。但是,实际上,根据地理学第一定律,相邻的交通小区之间,必然存在相关关系,比如,网约车出行量大的小区,通常是扎堆的,一个小区的出行量与其相邻小区的出行量通常是相关的,这就是空间依赖(spatial dependence)或空间自相关(spatial autocorrection)。OLS忽略了这种空间依赖,会导致模型设定错误,造成错误或有偏的结果。通过空间计量模型,我们可以捕捉空间依赖的结构,将其放入方程中,使模型更为准确。常用的空间计量模型包括空间滞后模型(SLM)和空间误差模型(SEM),前者假设空间依赖存在于因变量中,后者假设空间依赖存在于误差项(不可观测的因素)中。下面上代码,给大家介绍一下应用空间计量模型的基本流程。用到的数据还是GWR那篇文章中的数据,感谢滴滴盖亚计划。
首先,我们对数据进行处理,具体的方法在前几期都讲过了,这里不展开。本次分析是以成都市的街道作为分析单位的,共有90个街道,也就是说有90个样本。处理过后的数据长这样: