爬虫设置代理

以下是自己总结的设置 IP 代理的几种方法,仅供参考

 

方法一:

  requests发送请求添加代理

  proxies = {'http':'代理 IP:端口号'}

实例:

1 import requests
2 
3 url = 'www.baidu.com'
4 
5 response = request.get(url=url, proxies={'http':'ip:port'})

 

方法二:

  调用 ProxyHandler 添加 代理

实例: 

 1 from urllib import request
 2 
 3 url = 'www.baidu.com'
 4 
 5 # 设置代理
 6 handler = request.ProxyHandler({'http':'ip:port'})
 7 opener = request.bulid_opener(handler)
 8 
 9 # 发送请求
10 req = request.Request(url=url)
11 response = opener.open(req)

 

方法三:

  使用 client 建立连接,添加代理 IP,port

实例:

1 from http import client
2 
3 url = 'www.baidu.com'
4 
5 conn = client.HTTPConnection(ip, port, timeout=5)
6 response = conn.request('GET',url=url)

方法四

  在 scrapy下载中间件添加代理

  •   middlewares.py 自定义一个代理类,重写 process_request 方法
1 class MyDaiLi(object):
2     """docstring for MyDaiLi"""
3     # 重写这个方法
4     def process_request(self, request, spider):
5         request.meta['proxy'] = 'http://ip:port'
  •   settings.py (第55行)打开下载中间件,并将自定义的 MyDaiLi添加进去
1 DOWNLOADER_MIDDLEWARES = {
2    'daili_loginproject.middlewares.MyDaiLi': 543,
3 }

 

转载于:https://www.cnblogs.com/sharepy/p/9603783.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值