关于写爬小姐姐图片网站的几个问题

文章介绍了在Python中判断list是否为空的方法,以及使用PIL库处理图片时可能出现的识别错误,包括模块导入、图片格式问题和网络请求错误。针对网络请求,提到了SSLError和InsecureRequestWarning的解决方案,以及处理ConnectionError的建议,如限制请求速度。
摘要由CSDN通过智能技术生成

问题篇

一、如何判断list列表是否为空

使用len列表长度判断:

if len(list_test):

        print('list_test 为空')

二、PIL.UnidentifiedImageError: cannot identify image file <_io.BytesIO object at 0x000001

此问题一般出在get到图片链接,准备将图片转化的时候。

原因可能是以下几种:

1.模块没有安装正确

2.导包的问题,没有正确导包

【远古时代的代码用的是import Image ,现在Image已经被并入PIL库,所以要从PIL中import。即from PIL import Image】【还可以尝试卸载pip uninstall pillow重新安装pillow库 pip install pillow】

3.图片问题,导致没法识别读取

【这里自己碰到一个问题,没有解决:小姐姐网站有些图片是从其他网站图库出来的,图片并不算很大,但是加载的时候,图片是一行行显示的,导致无法image.open】

4.常规request.get(url=url,headers=headers)出现错误

requests.exceptions.SSLError: HTTPSConnectionPool

原因:这个网站是https的网站,当指定的headers的user-agent时,网站的服务器会重定向,因此报出SSL验证失败的错误。

解决方案:改为response = requests.get(url=url, verify=False)

5.同上,爬https网站正常爬到东西了,但是一堆警告信息

InsecureRequestWarning: unverified HTTPS request is being made to host

原因:urlib3 基于证书验证的级别出发不同的警告,比如说 InsecureRequestWarning ,没有验证的时候回出现这个警告。当然,未经验证的HTTPS URL时不被提倡的,如果你想强制取消警告,你可以使用 “disable_warnigns():”

解决方案:在开头添加

 import urllib3
 urllib3.disable_warnings()

6.爬网站一段时间出现:requests.exceptions.ConnectionError

原因:程序请求速度过快

解决方案:time.sleep()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值