分享一个之前做做过的项目,一个美国的外卖平台Doordash.
前期开发很顺利,程序正常跑了4个月左右 ,突然间网站改版,之前的接口位置并未改动,改版后还在那个原位置没有动,可是,一直请求不到,找了好长时间,才发现是http2.0的……
话不多说,肝着!
1.先看进入页面,通过charles 抓包工具进行抓包
2.观察charles抓到包的信息
3.发现抓到的包里 http请求是2.0的 http2.0对爬虫很不友好,因为requests不支持http2.0的请求,scrapy框架只是支持最基础的http2.0的请求, 那么就该导入我们今天的主角了,httpx!httpx支持http2.0的请求
4.使用httpx
httpx添加代理(httpx.Client)