高德地图爬虫

本文介绍了如何使用Python进行高德地图爬虫,详细讲述了需求分析、数据准备和爬虫实现思路。针对高德地图爬虫中遇到的验证码问题,提出了通过更换IP来解决。同时,提供了网页参数分析,帮助理解数据获取过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

高德地图爬虫

工具:Pycharm,win10,Python3.6.4

1.需求分析

这篇爬虫和上一篇百度地图爬虫要求一样,百度地图爬虫我发现有一个auth参数会一直变化,一旦变化则获取的数据是不准确的,所以我上高德地图看了一下,高德地图没有这个反爬机制。但是高德地图大概爬取120个页面就会跳一次验证码,我这里是通过换IP解决这个问题的。

2.数据准备

同样我们需要全国地级市信息,用之前的数据即可

3.爬虫思路

首先打开高德地图搜索一个城市的养老院数量,看看需要的参数有哪些,已经我们要的信息在什么地方。

按照这个步骤我们就能看到我们要的养老院数量就存放在这个位置,我们只需要获取该网页即可获取信息。网页参数如下

红色方框即为我们需要的参数,有些参数可以省略,这个自行尝试。

代码如下:

import requests
import json
import xlwt
from urllib.parse import urlencode
import xlrd

# 设置请求头,模拟浏览器访问
header
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值