爬虫【10】 cookie模拟登陆
爬虫回顾:
- 爬虫【1】打开网站,获取信息
- 爬虫【2】重构UserAgent
- 爬虫【3】URL地址编码
- 爬虫【4】爬取百度贴吧并生成静态页面
- 爬虫【5】爬虫猫眼电影100榜单并保存到csv
- 爬虫【6】链家二手房信息和图片并保存到本地
- 爬虫【7】链家二手房信息和图片并保存到本地
- 爬虫【8】request.get()参数详解
- 爬虫【9】 小米应用商店爬虫(多线程)
- 爬虫【10】 cookie模拟登陆
方法1 利用cookie
1、先登录成功1次,获取到携带登陆信息的Cookie(处理headers)
2、利用处理的headers向URL地址发请求
方法2 利用requests.get()中cookies参数
1、先登录成功1次,获取到cookie,处理为字典
2、res=requests.get(xxx,cookies=cookies)
方法3 利用session会话保持
1、实例化session对象
session = requests.session()
2、先post : session.post(post_url,data=post_data,headers=headers)
1、登陆,找到POST地址: form -> action对应地址
2、定义字典,创建session实例发送请求
# 字典key :<input>标签中name的值(email,password)
# post_data = {'email':'','password':''}
3、再get : session.get(url,headers=headers)