爬虫一些爬取图片时出现的错误

最新推荐文章于 2024-02-01 09:59:25 发布

Neflibata_mo

最新推荐文章于 2024-02-01 09:59:25 发布

阅读量1.2w

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Neflibata_mo/article/details/115406135

版权

报错

** 在爬取大量图片时遇到的报错**
在这里插入图片描述

解决方法：

IP被封
更换headers或者换代理IP

proxies = {"http": "http://101.132.111.208:8082"}

** 注：代理分为http和https两种，不能用混。**

http的连接数超过最大限制。
request的连接数过多而导致Max retries exceeded
在header中不使用持久连接。
headers的Connection参数默认为keep-alive，导致之前所有的链接都一直存在，占用了后续的链接请求。

requests.adapters.DEFAULT_RETRIES = 5  # 增加重连次数
s = requests.session()
s.keep_alive = False  # 关闭多余连接

网站服务器太差，爬取请求的速度太快。

    time.sleep(1)

就我个人的情况而言：第一种方法更适用。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
爬虫一些爬取图片时出现的错误

报错** 在爬取大量图片时遇到的报错**解决方法：IP被封更换headers或者换代理IPproxies = {"http": "http://101.132.111.208:8082"}** 注：代理分为http和https两种，不能用混。**http的连接数超过最大限制。headers的Connection参数默认为keep-alive，导致之前所有的链接都一直存在，占用了后续的链接请求。requests.adapters.DEFAULT_RETRIES = 5 # 增加
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。