使用的第三方库『cloudscraper
』可以绕过免费版的五秒盾。但遇到付费版就无能为力了。
最近在爬币圈的网站,其中有一个网站叫做:Codebase[1] 使用的就是付费版的 CloudFlare 五秒盾。当我们使用 CloudScraper 去爬时,报错如下:
那么现阶段,付费版的 CloudFlare 五秒盾,有没有什么办法绕过呢?其实方法非常简单。只需要使用 Docker 运行一个容器就可以了。启动命令为:
docker run -d \
--name=flaresolverr \
-p 8191:8191 \
-e LOG_LEVEL=info \
--restart unless-stopped \
ghcr.io/flaresolverr/flaresolverr:latest
这个容器启动以后,会开启 8191 端口。我们通过往这个端口发送 http 请求,让他转发请求给目标网站,就可以绕过五秒盾。
具体使用示例:
import requests
import json
url = "http://localhost:8191/v1"
payload = json.dumps({
"cmd": "request.get",
"url": "https://www.coinbase.com/ventures/content",
"maxTimeout": 60000
})
headers = {
'Content-Type': 'application/json'
}
response = requests.post(url, headers=headers, data=payload)
# 这个Docker镜像启动的接口,返回的数据是JOSN,网页源代码在其中的.solution.response中
print(response.json()['solution']['response'])
访问效果如下图所示:
我们再写几行代码来提取一下标题:
我们启动的这个容器,为什么可以绕过 CloudFlare 的五秒盾呢,关键原因就在这个项目中:FlareSolverr[2]。大家可以阅读他的源代码,看看他是怎么绕过的。
[1]
Codebase: https://www.coinbase.com/ventures/content
[2]
FlareSolverr: https://github.com/FlareSolverr/FlareSolverr
END