requests高级操作
目录
1.cookie的处理
2.代理操作
3.验证码识别
4.模拟登陆
一、cookie
- cookie是存储在客户端的一组键值对
- cookie是由服务器端创建
- cookie应用的简单实例:
- 免密登陆(指定时长之内)
在爬虫中处理cookie的两种方式
- 手动处理
- 将cookie封装到headers字典中,将该字典作用到get/post方法中的headers参数中
- 自动处理
- Session对象
- Session对象的创建:requests.Session()
- 对象的作用:
- 可以跟requests一样调用get/post进行请求的发送。在使用session进行请求发送的过程中,如果产生cookie,则cookie会被自动存储到session对象中
- 在爬虫中使用session处理cookie时,session对象至少需要被用几次?
- 两次,第一次是为了捕获和存储cookie到session对象中,第二次就是用携带cookie的session进行请求发送,这次请求发送就是携带cookie发起的请求