基于Python的互联网地图POI爬取(一)

1.POI介绍

POI(Point of Interest,兴趣点)是指在地理空间中具有特定吸引力或价值的地点,目前多指互联网地图中的兴趣点数据,在科研和商业领域都具有重要的价值,如城市与区域规划、交通与流动性研究、精准营销与定向广告、商业选址与市场拓展等。

2.‌互联网地图介绍

目前,国内主要的互联网地图服务商包括高德地图、百度地图和腾讯地图。此外,还有一个国家队的天地图。各地图都有开放接口可供调用以获取POI数据,相关接口如下:

高德:搜索POI-高级 API 文档-开发指南-Web服务 API | 高德地图API

百度:地点检索 | 百度地图API SDK

腾讯:WebService API | 腾讯位置服务

天地图:天地图API

各地图的接口都有一定的调用限制,由于会有变动,在此不作过多介绍,需要可自行官网查询。以下为高德地图限制:

3.‌相关接口介绍

各地图所提供POI相关接口众多,且称呼不一,但搜索相关功能大致可归为以下几类。

(1)圆形搜索

给定一特定坐标点与半径,搜索圆形区域内的相关POI,在高德与腾讯地图中叫作“周边搜索”。高德地图如下:

百度地图如下:

(2)行政区划搜索

通过给定行政区域的名称或代码,以查询区域内的相关POI。通常含有两个重要字段:关键字与区域名。高德地图中该接口被称为“关键字搜索”,因为关键字是必选字段,而city是可选字段,如下:

百度地图称为“行政区划区域检索”,两参数皆为必填,如下:

(3)多边形搜索

多边形搜索,顾名思义,给定一个多边形区域(如矩形、不规则多边形等),查询区域内的相关POI。高德如下:

腾讯如下:

4.POI爬虫介绍

(1)本爬虫采用多边形搜索中的矩形方式,因为矩形区域可以很好的支持递归搜索,在单一区域内POI数量过多时,可以将原矩形一分为四,可以很好的实现区域闭合,不会遗漏(圆形搜索就难以满足)。

(2)由于本爬虫开发时百度未对个人开放配额,因而没有适配百度地图的代码。后续会对爬虫中的各模块进行介绍,目前支持高德、腾讯、天地图。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雪山青木

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值