业余时间研究了一下兴趣点这一常见GIS数据的获取,总结如下。
获取思路
- 1、将待抓取区域切割成一定大小的矩形,如400米边长的矩形;
- 2、对每个矩形调用百度/高德等提供的接口,获取该矩形范围内兴趣点数据。
- 3、将兴趣点数据去重合并。
注意事项
坐标系
受国内政策、地图平台自身商业需要,各地图平台使用的坐标系各有不同。
- 百度:BD09;
- 高德:GCJ02;
- 腾讯:GCJ02;
- 天地图:CGCS 2000;
去重
兴趣点注意根据百度等返回的ID去重。
成果--PoiCrawler
PoiCrawler是使用C#编写的一个跨平台命令行工具,支持对国内各层级行政区(粒度最小到区县)的各类兴趣点数据获取。
使用
PoiCrawler -n 任务名称 -r 行政区划编码 -t 类型 -g 网格边长(米,默认400) -w 并行抓取数量(默认2)-i 抓取频率(秒,默认1秒)
- 抓取结果会自动生成在抓取器文件夹下,文件名同如任务名称;
- 抓取结果为WGS84坐标系;结果已去重;
- 抓取结果为CSV格式;
- 抓取没有总量,频率限制。
使用样例
PoiCrawler crawl -n 武汉餐饮 -r 420100 -t 餐饮服务 //抓取武汉市餐饮类型兴趣点
PoiCrawler crawl -n 武昌区餐饮 -r 420106 -t 餐饮服务 -g 400 -w 2 -i 1 //抓取武昌区餐饮类型兴趣点&#