geoda空间自相关分析_R语言空间数据分析（七）：空间自相关

最新推荐文章于 2024-08-19 20:10:34 发布

weixin_39957265

最新推荐文章于 2024-08-19 20:10:34 发布

阅读量1.7k

点赞数

文章标签： geoda空间自相关分析

本文链接：https://blog.csdn.net/weixin_39957265/article/details/113073576

版权

本文介绍了如何使用R语言进行空间自相关分析，通过计算Moran's I、Geary's C和局部G统计量来揭示数据的空间分布特征。作者使用了英国选区的地理边界数据，计算了名人故居的分布，并通过spdep包进行空间邻接关系的确定。结果显示，伦敦选区中名人故居呈现集群分布。同时，文章提供了局部统计量的计算与可视化方法，以帮助识别空间中的异常值。

摘要由CSDN通过智能技术生成

作者：黄天元，复旦大学博士在读，热爱数据科学与开源工具（R），致力于利用数据科学迅速积累行业经验优势和科学知识发现，涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等，著有《R语言高效数据处理指南》（《R语言数据高效处理指南》(黄天元)【摘要书评试读】- 京东图书）。知乎专栏：R语言数据挖掘。邮箱：huang.tian-yuan@qq.com.欢迎合作交流。

https://zhuanlan.zhihu.com/p/283199848zhuanlan.zhihu.com

这个帖子接着上次在HopeR：R语言空间数据分析（六）：空间点分布特征中使用的例子，继续进行拓展，来解释量化空间自相关的几种系数及其实现。这里，我们先载入英国选区的地理边界数据：

# 数据读入
LondonWards <- st_read("data/NewLondonWard.shp")
# 观察坐标系
st_crs(LondonWards)
# 可视化
tmap_mode("view")
# 选取数据子集
BluePlaquesSub <- BluePlaques[LondonWards,] 
tm_shape(LondonWards) +
  tm_polygons(col = NA, alpha = 0.5) +
  tm_shape(BluePlaquesSub) +
  tm_dots(col = "blue")

然后，我们需要对地理信息进行数据操作，首先让选区信息与名人故居做连接，然后我们对选区名称进行计数（事实上是计算每个选区内有多少名人故居），再利用st_area函数来计算选区面积，有了面积还可以对故居密度进行计算。最后，我们选出我们需要的一些变量。实现代码如下：

points_sf_joined <- LondonWards%>%
  st_join(BluePlaquesSub)%>%
  add_count(WardName)%>%
  #calcualte area
  mutate(area=st_area(.))%>%
  #then density of the points per ward
  mutate(density=n/area)%>%
  #select density and some other variables 
  dplyr::select(density, WardName, WardCode, n, AvgGCSE201)

下一步，我们想直接利用汇总数据来进行可视化。因为面积和密度这些数据是汇总数据，因此直接取第一个数