爬虫代理

最新推荐文章于 2024-07-29 15:35:41 发布

小阿柴

最新推荐文章于 2024-07-29 15:35:41 发布

阅读量141

点赞数

文章标签： python

本文链接：https://blog.csdn.net/qq_39686682/article/details/106489127

版权

ProxyHandler处理器

1.代理的原理：在请求目的网站之前，先请求代理服务器，然后让代理服务器去请求目的网站，代理服务器拿到目的网站的数据后，再转发给我们的代码。
2.http://httpbin.org：这个网站可以方便的查看http请求的一些参数。
3.在代码中使用代理：
* 是用’urllib.request.ProxyHandler’，传入一个代理，这个代理是一个字典，字典的key依赖于代理服务器能够接收的类型，一般是’http‘或者’https‘，值是’ip:port‘。
* 使用上一步创建的’handler’，以及’request.build_opener‘创建一个’opener‘对象。
* 使用上一步创建的’opener‘，调用’open‘函数，发起请求。

示例代码如下：

from urllib import request

# 没有使用代理
# url = 'http://httpbin.org/ip'
#
# resp=request.urlopen(url)
# print(resp.read())

#使用代理
url = 'http://httpbin.org/ip'
handler = request.ProxyHandler({"http":"125.108.111.88"})
opener = request.build_opener(handler)
resp = opener.open(url)
print(resp.read())

小阿柴

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫代理

ProxyHandler处理器1.代理的原理：在请求目的网站之前，先请求代理服务器，然后让代理服务器去请求目的网站，代理服务器拿到目的网站的数据后，再转发给我们的代码。2.http://httpbin.org：这个网站可以方便的查看http请求的一些参数。3.在代码中使用代理：* 是用’urllib.request.ProxyHandler’，传入一个代理，这个代理是一个字典，字典的key依赖于代理服务器能够接收的类型，一般是’http‘或者’https‘，值是’ip:port‘。* 使用上一步创
复制链接

扫一扫