背景
百度提供了丰富的POI数据,有些场景下我们需要把这些数据放到内网环境下,这个时候就要想办法把数据爬下来。
学习准备
百度API接口学习
百度API提供了一个叫Place API获取poi的接口,有个城市内检索 实例为
http://api.map.baidu.com/place/v2/search?query=美食&page_size=10&page_num=0&scope=1®ion=北京&output=json&ak={您的密钥}
它返回的是个json类型数据,一个区域最大返回数为400,每页最大返回数为20。显然一个城市内不管什么类别的poi,不可能只有400个,会遗漏数据,故舍去此方法。
还有一个矩形区域检索,实例为