原文链接
ArcGIS与地理加权回归GWR【二】以及MGWR软件下载https://mp.weixin.qq.com/s/IslFNMrulsmBYgd7aa26xQ
带宽,即核函数的覆盖范围,核函数计算出来的是或陡或缓的曲面,曲面底部的半径便是带宽,带宽越大,覆盖范围就越大,权重随着距离的增加衰减的也就越慢(曲面越缓),带宽越小,覆盖范围越小,权重随着距离的增加衰减的就越快(曲面越陡)。
带宽过大会导致回归参数估计的偏差过大,带宽过小又会导致回归参数估计的方差过大,过大或者过小都会导致结果的不准确性,因此确定合适的带宽大小十分重要。
带宽的确定
在ArcGIS中,带宽方法的选择会有AICc、CV、BandWidth_Parameter三个选项。核类型有Fixed和Adaptive(这个下面会提)。
而常用的带宽优化方法一般有以下几种,了解就行啦反正也看不懂。
1、CV 交叉验证
代表回归参数估计不包括回归点本身,即只根据回归点周围的数据点进行回归计算,这样当b变得很小时,模型仅刻画i附近的样本点但不包括i本身。把不同的带宽b及其对应的CV值绘制成趋势线,就可以直观的找到最小的CV值对应的最优带宽b。
2、AIC 赤池田信息准则
Akaike通过极大似然原理的估计参数方法加以修正,提出了AIC,Brunsdon和Fotheringham将其进一步用于地理加权回归分析中的权函数带宽选择。
别看了,看不懂的
下标c为“修正后的”AIC估计值,n为样本空间单元的数量,σ^为误差项估计的标准离差,AIC有利于评价GWR模型是否比OLS模型更好的拟合数据。AIC最小的就是坠好的
后面这两个不写了,反正ArcGIS里就CV和AIC,MGWR里多了个BIC。
3、BIC 贝叶斯信息准则
4、SI 平稳指数
自适应权函数
上述最优带宽的选择比较适用于地理空间单元数据均匀分布的情况,如果数据在区域内分布不均匀,数据密集的地方借用的点就多,数据稀疏的地方借用的点就少,要不就是偏差太大或方差过大。针对这种情况,可以根据数据疏密程度,在不同回归点上选取不同的带宽,即在数据稀疏的区域采用较大的带宽,而在数据密集的区域采用较小的带宽,这种在不同回归点上采用不同带宽的方式,就成为自适应权函数。有高斯函数和Bi-square函数。在上篇结尾提过ArcGIS与地理加权回归GWR【一】
所以这也就是前面ArcGIS中让选择核类型是Fixed(固定)还是Adaptive(自适应)
ps:ArcGIS中只有高斯核
-
参考:《空间数据分析》
我觉得写这么简陋有点水了,下面提一下MGWR软件以及样例数据下载,因为我想拿样例数据来练习做,还是会用ArcGIS做的,不能偏题啊也
ASU网站:https://sgsup.asu.edu/sparc/multiscale-gwr
根据自己电脑情况下载即可,点下载会让填两个信息,随便填一下就行
Sample Data,下载这个Georgia的受教育程度及各因素的空间差异
数据包括矢量和表格。
PctBach:本科以上人口占比(因变量),PctRural:乡村人口占比,PctEld:老龄人口占比,PctFB:外国出生人口占比,PctPov:贫困人口占比,PctBlack:非洲裔美国人占比,TotPop90:1990 年人口数量。
不想动手的公众号回复关键词【MGWR】自取。