使用Python登录饿了么网站,爬取自己家附近的餐厅列表

python学习
题目要求:在本练习,我们会借助cookies的相关知识,使用Python登录饿了么网站,爬取自己家附近的餐厅列表。

网站地址:https://www.ele.me/home/
第一步,模拟手机号发送验证码
1。打开饿了吗登录界面,输入手机号,发送页面,打开network ,发现出现一个mobile_send_code 请求,这个就是发送验证码的请求,点开preview可以看见发送验证码成功后,返回了一个token,这个token 后期登录会用上
在这里插入图片描述
2.查看hearder,最下面有一些参数,mobile就是我们刚刚输入的手机的号码
在这里插入图片描述
3.编写发送验证码的代码,运行代码手机收到验证码,即为成功(注意饿了么如果手机多次发送验证码之后,就会需要用图形验证码验证,此时这个代码就会报错,所以一定要注意次数,不要验证码发送次数过多

import requests
session = requests.session()

headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
url_1 = 'https://h5.ele.me/restapi/eus/login/mobile_send_code'
tel = input('请输入手机号码:')
data_1 = {'captcha_hash':'',
        'captcha_value':'',
        'mobile':tel,
        'scf':''}在这里插入代码片

第二步 登录饿了么
1.输入手机号,和验证码,点击登录后,出现一个新的请求login_by_mobile
在这里插入图片描述
2,划到最下面,查看这个请求的参数,可以看见moblie就是手机号,validate_code是验证码,validate_token,就是第一步中获取验证码返回的token;
在这里插入图片描述
3.编写登录的代码

url_2 = 'https://h5.ele.me/restapi/eus/login/login_by_mobile'
code = input('请输入手机验证码:')
data_2 = {'mobile':tel,
        'scf':'ms',
        'validate_code':code,
        'validate_token':token}

session.post(url_2,headers=headers,data=data_2)

第三步:输入收货地址
1.点击登录之后,我们可以看见我们进入到这个页面,输入收货地址
在这里插入图片描述
2.输入一个收货地址,如贵州大学,出现了如下地址信息
在这里插入图片描述3.发现左边出现一个serach 的请求,这个请求的参数key word是我们刚刚输入的收货地址,geohash是城市的代号,latitude,longitude分别是经纬度
在这里插入图片描述
4.点击preview ,出现刚刚搜索的与贵州大学相关的地址信息
在这里插入图片描述
5.、模拟输入地址,获取必要参数

address_url = 'https://www.ele.me/restapi/v2/pois?'
place = input('请输入你的收货地址:')
params = {'extras[]':'count','geohash':'ws105rz9smwm','keyword':place,'limit':'20','type':'nearby'}
# 这里使用了深圳的geohash

address_res = requests.get(address_url,params=params)
address_json = address_res.json()

print('以下,是与'+place+'相关的位置信息:\n')
n=0
for address in address_json:
    print(str(n)+'. '+address['name']+':'+address['short_address']+'\n')
    n = n+1
address_num = int(input('请输入您选择位置的序号:'))
final_address = address_json[address_num]

第四步:获取输入地址附近的餐厅列表
在这里插入图片描述1.成功输入地址之后,转到主页面,会看见下面推荐了附近一些比较近的餐厅,用户点击network,查看请求,出现一个restaurant的请求,很明显这个请求就记录餐厅的信息
在这里插入图片描述在这里插入图片描述3.提取附近的餐厅信息

restaurants_url = 'https://www.ele.me/restapi/shopping/restaurants?'
# 使用带有餐馆列表的那个XHR地址。
params = {'extras[]':'activities',
'geohash':final_address['geohash'],
'latitude':final_address['latitude'],
'limit':'24',
'longitude':final_address['longitude'],
'offset':'0',
'terminal':'web'
}
# 将参数封装,其中geohash和经纬度,来自前面获取到的数据。
restaurants_res = session.get(restaurants_url,params=params)
# 发起请求,将响应的结果,赋值给restaurants_res
restaurants = restaurants_res.json()
# 把response对象,转为json。
for restaurant in restaurants:
# restsurants最外层是一个列表,它可被遍历。restaurant则是字典,里面包含了单个餐厅的所有信息。
    print(restaurant['name'])

最后贴上完整代码

import requests
session = requests.session()

headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
url_1 = 'https://h5.ele.me/restapi/eus/login/mobile_send_code'
tel = input('请输入手机号码:')
data_1 = {'captcha_hash':'',
        'captcha_value':'',
        'mobile':tel,
        'scf':''}

token = session.post(url_1, headers=headers, data=data_1).json()['validate_token']

url_2 = 'https://h5.ele.me/restapi/eus/login/login_by_mobile'
code = input('请输入手机验证码:')
data_2 = {'mobile':tel,
        'scf':'ms',
        'validate_code':code,
        'validate_token':token}

session.post(url_2,headers=headers,data=data_2)


address_url = 'https://www.ele.me/restapi/v2/pois?'
place = input('请输入你的收货地址:')
params = {'extras[]':'count','geohash':'ws105rz9smwm','keyword':place,'limit':'20','type':'nearby'}
# 这里使用了深圳的geohash

address_res = requests.get(address_url,params=params)
address_json = address_res.json()

print('以下,是与'+place+'相关的位置信息:\n')
n=0
for address in address_json:
    print(str(n)+'. '+address['name']+':'+address['short_address']+'\n')
    n = n+1
address_num = int(input('请输入您选择位置的序号:'))
final_address = address_json[address_num]

restaurants_url = 'https://www.ele.me/restapi/shopping/restaurants?'
# 使用带有餐馆列表的那个XHR地址。
params = {'extras[]':'activities',
'geohash':final_address['geohash'],
'latitude':final_address['latitude'],
'limit':'24',
'longitude':final_address['longitude'],
'offset':'0',
'terminal':'web'
}
# 将参数封装,其中geohash和经纬度,来自前面获取到的数据。
restaurants_res = session.get(restaurants_url,params=params)
# 发起请求,将响应的结果,赋值给restaurants_res
restaurants = restaurants_res.json()
# 把response对象,转为json。
for restaurant in restaurants:
# restsurants最外层是一个列表,它可被遍历。restaurant则是字典,里面包含了单个餐厅的所有信息。
    print(restaurant['name'])
  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值