Python反爬突破Cloudflare5秒盾的处理

最新推荐文章于 2024-09-06 10:51:16 发布

疯狂份子

最新推荐文章于 2024-09-06 10:51:16 发布

阅读量1.7k

点赞数 2

分类专栏： Python 文章标签： python 开发语言前端

本文链接：https://blog.csdn.net/wenf100/article/details/137920263

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文讲述了在爬取一个受Cloudflare保护的网站时，作者分享了使用Cloudscraper和curl_cffi库绕过反爬5秒盾的方法，通过模拟ChromeUser-Agent解决了问题，代码简洁有效。

摘要由CSDN通过智能技术生成

最近爬一个网站，遇到了个很棘手的问题，网页访问正常，查看网页源码内容能看到想要的信息，但是用python去爬的话就会遇到反爬Cloudflare 5秒盾的检测，返回各种比如Just a moment…等等的结果，最后用了两种方法解决
1、使用Cloudscraper
这个估计是大部分人的解决方法了，毕竟很实用，直接上代码

import re
# pip install cloudscraper
import cloudscraper
import urllib3
urllib3.disable_warnings()
url = 'https://www.xxx.com'
response = scraper.get(url).text
print(response)

2、使用curl_cffi

import re
# pip install curl_cffi 
from curl_cffi import requests
import urllib3
urllib3.disable_warnings()
url = "https://www.xxx.com"
response = requests.get(url,  impersonate="chrome101").text
print(response)