python 爬虫SSL错误是怎么回事?

今天摸鱼(划掉)看道一个问题蛮有意思的,想来展开说说:

别急,解决办法是有的。

1.这个错误很可能是因为你正在尝试读取一个 JSON 格式的响应,但是实际返回的却是 HTML 格式的响应。

我们检查一下我们的请求是否正确,并且确保请求的 URL 返回的是 JSON 格式的数据。如果确认请求 URL 返回的是 JSON 格式的数据,那么可以使用函数将返回的字节类型数据转换为 JSON 对象。

import json
import urllib.request

response = urllib.request.urlopen(url)
json_str = response.read().decode('utf-8')
json_obj = json.loads(json_str)

2.你用的是标准库ssl模块,那可能确实和前面那位uu说的一样,可能是底层OpenSSL库的问题有关。

解决办法人家也说了,更新一下版本,提醒你一下,如果是使用Linux操作系统,看看484安装了正确版本的OpenSSL库。

这些确认后,问题还是存在,就检查SSL证书的有效性和正确性,看程序有没有正确配置和使用证书。

如果SSL错误是由于证书问题引起的,则可能需要添加以下代码来加载证书:jsonhtml=jsonresponse.read()

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

这将创建一个未经验证的SSL上下文,从而跳过SSL验证过程。

不过这里要说一个,这是一个不安全的解决方案,不应该在生产环境中使用。

3.还有可能,需要换一家HTTP代理了。

买之前,先测试,这个没有人不知道吧,就不废话了。我们来说说成本问题,要如何在一众海量的HTTP代理厂商中,找到一家物美价优的呢?

稍等,问个度娘,大几千万条信息要筛选。

别急,我就看前面几家有那么实力投广的,整理了如下:

代表厂商

白名单数

基础套餐

(元/月)

平均IP单价

(元/IP)

青果网络

256

29

0.0006

小象代理

5

109

0.0050

巨量代理

5

155

0.0049

豌豆代理

5

300

0.0025

讯代理

1

210

0.0583

品易代理

20

120

0.0070

芝麻代理

5

360

0.0182

有需要的自取,记得给个赞。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值