R语言实现地理探测器详细教程及结果解读(一)——EXCEL离散数据

  1. GD包的安装与导入

install.packages("GD")##下载一下GD包library(GD)##载入我们所用的GD包

R语言的安装与配置详细R语言保姆级下载安装教程(R+Rtools+RStudio),附安装包

2.设置工作路径和读取文件

setwd("C:\\Users\\Cc\\Desktop\\新建文件夹")##CSV在的那个文件夹data<-read.csv("1990.csv")##读取我们第一步做的包括了自变量和因变量的csv表

3.检查数据

检查数据中的缺失值

summary(data)  # 查看数据的概况,包括缺失值

如果发现缺失值,可以考虑填补缺失值或删除缺失值所在的行。

data <- na.omit(data)  # 删除所有包含缺失值的行

4.数据离散化

输入数据中的自变量数据具有连续变量,需要将其转换为类别变量,我们可以选择的离散化方式包括相等间隔法、自然间断点法、分位数分类法、几何间隔法与标准差法等5种不同的方法,分别对应以下第一句代码中的"equal"、"natural"、"quantile"、"geometric"与"sd"等5个选项,程序会自动从5中离散化方法中选择最适合每一连续变量的最优离散方法。

discmethod <-c("equal","natural","quantile","geometric","sd")##离散化方式选择为这5中方法

c(4:10)就表示我们分别将每一个连续变量分为4类、5类、6类,以此类推,一直到10类,从其中找到最优结果对应的类别数量。从时间考虑这里选择(4:6)

discitv <-c(4:6)##分成5~10类,毕竟我们要看哪种q值最大

5.分析

调用gdm()函数,执行地理探测器分析的具体操作;其中,datagdm为保存地理探测器结果的变量;

第一行y代表因变量,x代表自变量,将所有的自变量用“+”相连。

第二行输入连续变量,代码中x6为土地利用数据,为类型变量因此不用输入。

第三行为表示存储自变量与因变量数据的数据框(Data Frames)格式的变量;最后两个变量,即为前面我们选择的离散化方法与类别数量。

datagdm <- gdm(y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 ,##第一个放为我们的因变量Y,其他的就是我们的自变量              continuous_variable =c("x1", "x2","x3","x4","x5","x7"),##这里把我们的连续变量输入在这里,类型变量就不输入              data = data,              discmethod = discmethod,              discitv= discitv) datagdmplot(datagdm)

6.完整代码

setwd("C:\\Users\\Cc\\Desktop\\新建文件夹")##CSV在的那个文件夹install.packages("GD")##下载一下GD包library(GD)##载入我们所用的GD包data<-read.csv("1990.csv")##读取我们第一步做的包括了自变量和因变量的csv表summary(data)  # 查看数据的概况,包括缺失值data <- na.omit(data)  # 删除所有包含缺失值的行head(data)[1:3,]##看一眼前三行数据discmethod <-c("equal","natural","quantile","geometric","sd")##离散化方式选择为这5中方法discitv <-c(4:6)##分成5~10类,毕竟我们要看那种q值最大datagdm <- gdm(y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 ,##第一个放为我们的因变量Y,其他的就是我们的自变量              continuous_variable =c("x1", "x2","x3","x4","x5","x7"),##这里把我们的连续变量输入在这里,类型变量就不输入              data = data,              discmethod = discmethod,              discitv= discitv) datagdmplot(datagdm)

6.结果解读

这里表示x1最优的分类方法是自然间断点法,最优类别数量为6类。下面为分类区间,和区间内总计的样本数量。

因子探测结果,qv表示q值为解释力,sig为显著性结果。将结果复制到EXCEL中,【数据】-【分列】显示,保留两位小数显示。

风险区探测结果用于判断两个子区域间的属性均值是否有显著的差别,“Y”表示具有显著差异“N”表示不显著差异。

交互作用探测评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。

生态探测用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异。

表示不同类别数量各个因子的q值情况。

表示最优分类方法、最优类别数量的区间内样本数量总计。

表示q值大小排列。

风险区探测,每个因子在各个分类区间的风险平均值和显著性检验​。

交互探测,表示x2和x3的交互作用对​y的解释力最大。

​生态探测用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异。

  • 10
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值