PySpark空间计算学习总结—(6)PySpark实战例一处理7500w人口大数据
一、前沿说明需求:目前手上有 7500w 条全国人口数据(点数据,有四个字段,分别是时间、经度、维度、标记),csv 格式。现在要找到哪些数据在广东省内。分析:可以将人口数据与广东省行政区进行求交集,即点数据和面数据求交集,则可以得出在广东省境内的人口数据。方法:这里用 GDAL 中的 ogr 求交集方法。首先读取广东省行政区划数据(广东省行政区划数据为 shp 格式,是一个面数据),构造成...
原创
2020-03-31 23:44:49 ·
766 阅读 ·
2 评论