空间数据分析与r语言实践_R语言空间数据分析(一):总论

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

HopeR:R语言空间数据分析(零):总目录​zhuanlan.zhihu.com

最近对空间分析比较感兴趣,所以准备开始系统学习一下R中的空间数据挖掘。国外资料已经非常多,知难行易,一点一点夯实基础。主要资料如下:

CASA0005 Geographic Information Systems and Science

Spatial Data Science

Geocomputation with R

Geodesic geometry

下面做一个简单的上手案例,就是读取shape格式文件,然后进行观察和可视化。一般来说,shape格式文件需要有三个文件,才能够成为一个完整的整体(分别是".shp", ".shx"与 ".dbf"文件,具体参考shapefile文件_百度百科)。我们演示的原始文件来自于:https://github.com/andrewmaclachlan/CASA0005repo/tree/master/prac10_data/statistical-gis-boundaries-london/ESRI,分别是以下3个文件:

94752109fb6a8115d2b78b1cb27d0453.png

我把它们放在data目录下,实现代码如下:

library(pacman)
p_load(sf)

shape <- st_read("data/London_Borough_Excluding_MHW.shp")

这样,就可以把shape格式的文件读入到R中,现在放到shape变量中了。它本质上是一个带有元信息的数据框,可以用summary来观察它的数据结构:

summary(shape)

455494c015d59f0ad106a4145cca6af9.png

同时可以进行可视化:

plot(shape)

58e2c0affabec1f30bccdac414b07017.png

我们可以看到,如果是分类变量,那么就会利用不同的离散颜色做区分;如果是数值变量,则会自动调用冷暖色调来做数值区分。此外,如果属性中只有缺失值,那么地理空间中将会是一片空白(如SUB_2009)。我们也可以只提取其地理属性(边界),然后进行可视化:

shape %>% 
  st_geometry() %>%
  plot()

61d3475e62e77b80060b6eca75c6e31b.png

tmap包提供了较好的可视化功能,不过包的加载可能会花费一些时间。比如,我们来对HECTARES变量进行可视化:

p_load(tmap)
tmap_mode("plot")
qtm(shape,fill = "HECTARES")

effae12e01f6637df50adf0803f53b50.png

这里图例位置显然安排不合理,但是以后再来提如何修改这些细节。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值