爬虫--代理池(requests 人人网实战)

IP代理:
原因
  1. 让服务器认为不是同一个客户端的请求
  2. 不易追踪自己的ip
检查可用性
  1. 使用requests加超时参数,判断ip质量
  2. 在线代理ip质量检测网站
代理池

字典形式,一堆ip,随机使用

用户代理:
代理池

使用一堆带有cookie的请求组成用户代理池

使用思路
  1. 实例化session
  2. 使用session发送请求,登陆网站,将cookie保存在session中
  3. 再使用session请求登陆之后才能访问的网站(session可以自动携带登陆成功时保存的cookie进行请求)
实战

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值