第二章基本库的使用之httpx

当遇到仅支持HTTP2.0协议的网站时,urllib和requests无法进行数据爬取。本文介绍了如何使用httpx库来解决这一问题。首先,通过示例展示了requests在尝试访问强制HTTP/2.0网站时会失败。接着,说明了httpx库的安装方法,需要Python 3.6及以上版本,通过`pip3 install ‘httpx[http2]’`进行安装。最后,阐述了httpx的基本用法,其API与requests类似,可以成功获取状态码、响应头和响应体。
摘要由CSDN通过智能技术生成

对于强制使用HTTP2.0/协议访问的网站,urllib和requests是无法爬取数据的,因为它们只支持HTTP1.1,不支持HTTP2.0,这时要使用httpx。

1、示例

https://spa16.scrape.center/就是强制使用HTTP/2.0访问的一个网站,这个网站用requests是无法爬取的,例:

import requests
url = 'https://spa16.scrape.center/'
re = requests.get(url)
print(re.text)

请求失败,抛出ConnectionResetError。

2、安装

可以直接使用pip3安装,所需的python版本是3.6及以上,安装命令为:

pip3 install ‘h

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

keven2840

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值