爬虫(五):requests模块使用代理

在这里插入图片描述
在这里插入图片描述

使用方法:

requests.get(‘http://www.baidu.com’,proxies=proxies)
proxies的形式为字典
proxies={
“http”:“http://12,34,56,78:8080”
或者:
“https”:“https://12,34,56,78:8080”
}

为什么使用代理
- 让服务器以为不是同一个客户端请求
- 防止真实地址泄露

例子:

import requests
'''
proxies代理ip
'''
def run():
    header = {
        'User-Agent': 'ozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'
    }
    proxies = {
        "http": "101.4.136.34:80"
    }
    r = requests.get('http://www.baidu.com', proxies=proxies, headers=header)
    print(r.status_code)


if __name__ == '__main__':
    run()

#####使用代理ip

  • 1.准备一堆ip,组成ip池,随机选择一个ip来使用
  • 如何随机选择代理ip
    • 对每个ip建立字典,包含ip和使用次数{‘ip’:‘xx’,‘times’:‘xx’},生成一个列表[{},{},{},…]然后按照times对其进行排序,选择使用次数较少的10个ip,从其中随机选择一个
      -2. 检查ip的可用性两种方法
    • 使用requests添加超时参数,判断ip地址的质量
    • 在线代理ip质量检测的网站
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值