python或Django关于Max retries exceeded with url 的错误——http连接太多没有关闭（好文章！！）

最新推荐文章于 2023-10-10 18:06:37 发布

HD243608836

最新推荐文章于 2023-10-10 18:06:37 发布

阅读量854

点赞数

分类专栏： Django 文章标签： Django Max retries exceeded url 连接

原文链接：https://blog.csdn.net/lb245557472/article/details/80239603

版权

Django 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

在爬取网址boss直聘时出现这种错误，于是搜索了网上很多文章，总结如下：
1.http连接太多没有关闭导致的，解决方法：

import requests
requests.adapters.DEFAULT_RETRIES = 5 # 增加重连次数
s = requests.session()
s.keep_alive = False # 关闭多余连接
s.get(url) # 你需要的网址 # 或者 requests.get(url)

2.访问次数频繁，被禁止访问，解决方法：使用代理

import requests
s = requests.session()
url = "https://mail.163.com/"
s.proxies = {"https": "47.100.104.247:8080", "http": "36.248.10.47:8080", }
s.headers = header
s.get(url) # 或者 requests.get(url)

查找代理的网址：http://ip.zdaye.com/shanghai_ip.html#Free
使用代理时需注意：
1.代理分为http和https两种，不能用混，如果把http的代理用作https也是会报上面的错误;
2.上面的代理以字典格式传入，例如上面的例子，可以是“47.100.104.247:8080”这种格式，也可以是“https://47.100.104.247:8080”这种格式；
3.如果代理不可用一样会报上面的错误。
以下方法判断代理是否可用：

import requests
s = requests.session()
url = "https://mail.163.com/"
s.keep_alive = False
s.proxies = {"https": "47.100.104.247:8080", "http": "36.248.10.47:8080", }
s.headers = header
r = s.get(url) # 或者 requests.get(url)
print r.status_code  # 如果代理可用则正常访问，不可用报以上错误

PS：

问题：
检测代理是否可用的代码会报错：NameError: name 'header' is not defined

解决：
你首先要定义一个header的，如果不定义就直接删掉s.headers = header这个

转载自：https://blog.csdn.net/lb245557472/article/details/80239603

HD243608836

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python或Django关于Max retries exceeded with url 的错误——http连接太多没有关闭（好文章！！）

在爬取网址boss直聘时出现这种错误，于是搜索了网上很多文章，总结如下：1.http连接太多没有关闭导致的，解决方法：import requestsrequests.adapters.DEFAULT_RETRIES = 5 # 增加重连次数s = requests.session()s.keep_alive = False # 关闭多余连接s.get(url) # 你需要的网址 # 或者 requests.get(url)2.访问次数频繁，被禁止访问，解决方法：使用代理impor
复制链接

扫一扫

专栏目录