对于强制使用HTTP2.0/协议访问的网站,urllib和requests是无法爬取数据的,因为它们只支持HTTP1.1,不支持HTTP2.0,这时要使用httpx。
1、示例
https://spa16.scrape.center/就是强制使用HTTP/2.0访问的一个网站,这个网站用requests是无法爬取的,例:
import requests
url = 'https://spa16.scrape.center/'
re = requests.get(url)
print(re.text)
请求失败,抛出ConnectionResetError。
2、安装
可以直接使用pip3安装,所需的python版本是3.6及以上,安装命令为:
pip3 install ‘h