DrissionPage过5秒盾：反CloudFlare反爬

爬虫俗手小马达

已于 2024-09-06 18:14:13 修改

阅读量4.2k

点赞数 25

分类专栏：爬虫文章标签： python 爬虫

于 2024-09-06 14:36:49 首次发布

本文链接：https://blog.csdn.net/m0_55893050/article/details/141957598

版权

5秒盾实例

偶尔有用的解决方式：

curl_cffi可以实现一些简单的反5秒盾。

pip install curl_cffi

from curl_cffi import requests as cffi_requests
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36",
}
url = ""
res = cffi_requests.get(url, impersonate='chrome110', timeout=10)
print(res.status_code, res.cookies)

无效的网站会返回 403 <Cookies[]>。

DrissionPage反反爬

这里采用DrissionPage自动化来反反爬。

pip install DrissionPage

安装后，编写代码：

from DrissionPage import ChromiumPage
from DrissionPage import ChromiumOpt

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爬虫俗手小马达

关注关注

25
点赞
踩
29

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！

小鸿的博客

07-09

3687

逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解 cloudflare（5秒盾）以及如何绕过使用 cloudflare 服务的网站从而抓取数据

使用Python绕过五秒盾反爬虫防护实战

吴秋霖的博客

11-03

8156

除了FlareSolverr之外的又一种绕过FlareSolverr爬虫防护解决方案！更加简单与便捷

1 条评论您还未登录，请先登录后发表或查看评论

from DrissionPage 过cf5秒盾

qq_42307546的博客

11-29

293

【代码】from DrissionPage 过cf5秒盾。

DrissionPage 过 cloudflare（已解决！！！！）

m0_53801612的博客

12-11

1104

我发现DrissionPage的点击只是模拟鼠标点击，不是真实鼠标点击。所以我就寻找什么可以操控鼠标，我找到了，是：pyautogui。经过测试，这个点击100%能过。只是需要你找到那个选中框在网页全屏的位置（Location=pyautogui.position()用这个方法就行）

使用 curl_cffi 解决 Web 抓取中的 TLS/JA3 指纹识别方法

最新发布

守城小轩的技术窝棚

03-26

795

curl_cffi是专门为网络请求设计的 Python 库，与requests和httpx等库有着相似的用途。然而，curl_cffi具有独特的优势，它可以模拟浏览器 TLS/JA3 和 HTTP/2 指纹。是一个强大的命令行工具，能够模拟四种主要浏览器的行为，并像真实浏览器一样执行 TLS 和 HTTP 握手。curl_cffi巧妙地使用cffi将包装成了 Python 库，从而让我们可以在 Python 环境中方便地使用这些功能。如今，大多数网站都采用了 HTTPS 协议来保障数据传输的安全性。

5秒盾cf-turnstile-response破解

qq_60611058的博客

04-08

3213

目前DrissionPage是直接绕过5秒盾模块（selenium，异步等都需要配置），不需要任何配置可直接绕过当前网站的保护。今天的任务就到这里，有不懂可以私，，，，下期：破解cloudflare缓存cookies的cf_clearance。希望多多关注一下下哦，下期如何破解cf_clearance。

在linux上面用drissionpage自动化遇到反爬？

十一姐的博客

07-25

1957

【代码】在linux上面用drissionpage自动化遇到反爬？

五种方法教你快速绕过5s盾反爬

程序烂人的博客

07-16

3112

五种方法教你快速绕过5s盾反爬

五秒盾解决方案

m0_61720747的博客

10-23

1490

加密方式：五秒盾 Cloudflare 解决方案：使用docker中的内置浏览器步骤一、在Linux中使用Docker命令docker上安装内置浏览器步骤二、开启服务器的端口，令外界与服务器可以通信步骤三、对服务器传入待访问的URL，返回html响应数据

爬虫：绕过5秒盾Cloudflare和DDoS-GUARD

gwb0516的专栏

08-23

7859

爬虫，绕过免费和付费版5秒盾Cloudflare的方法。

cloudflare-bypass:使用Cloudflare Workers绕过Coudflare机器人保护

04-01

绕过Cloudflare 一般的与我的中篇文章相关：详细操作步骤1：您向myproxy.tk提出了请求，因为我们将在CloudFlare上正确设置我们的域，因此您可以来自Tor或公共代理，而不会受到阻碍。步骤2：您的JS工作人员将...

cloudflare-ddns-4padavan:使用cloudflare API为Padavan定制ddns shell脚本

05-13

2. **Cloudflare API**：Cloudflare是一家提供CDN、DNS解析、安全等服务的公司。其API允许开发者通过编程方式管理DNS记录、配置SSL证书等功能。在这个项目中，我们使用Cloudflare API来更新A记录，保持与路由器公网...

laravel-cloudflare:将 Cloudflare ip 地址添加到 Laravel 的可信代理

08-04

信任 Cloudflare 的 Laravel 代理将 Cloudflare ip 地址添加到 Laravel 的可信代理。安装使用 Composer 安装： composer require monicahq/laravel-cloudflare 您不需要将此包添加到您的服务提供商。在app/...

request-cloudflare：支持cloudflare反ddos页面的请求模块

02-18

Node.js库绕过cloudflare的anti-ddos页面。如果您要访问的页面受到CloudFlare的保护，它将返回特殊页面，该页面期望客户端支持Javascript来解决挑战。这个小库封装了提取挑战，解决挑战，提交并返回请求页面...

自动绕过 Cloudflare 验证码 - 两条相反的方法（选择最适合您的方法）

Captcha_Bypass的博客

04-04

7393

自动化测试是持续集成的一个关键方面，在处理验证码等安全措施时经常会遇到挑战。对持续和重复测试运行的需求可能会触发安全机制，如Cloudflare验证码，从而导致测试失败。虽然有可能在测试执行期间禁用验证码，但在某些情况下这可能并不可行。在这篇博客文章中，我们深入探讨了Cloudflare验证码的世界，重点关注独立Cloudflare Turnstile验证码和Cloudflare Turnstile挑战页面。我们将探索这些验证码的复杂性，并讨论以自动化方式绕过它们的两种有效方法。

Python反爬突破Cloudflare5秒盾的处理

wenf100的博客

04-18

3117

最近爬一个网站，遇到了个很棘手的问题，网页访问正常，查看网页源码内容能看到想要的信息，但是用python去爬的话就会遇到反爬Cloudflare 5秒盾的检测，返回各种比如Just a moment…等等的结果，最后用了两种方法解决。基本上都是几行代码解决，已经适应了很多场景，基本上都能解决问题了。这个估计是大部分人的解决方法了，毕竟很实用，直接上代码。1、使用Cloudscraper。2、使用curl_cffi。

drissionpage知识整理与某数等反爬产品绕过实战

九月镇灵将的博客

01-08

2135

DrissionPage是一个基于 Python 的网页自动化工具。既能控制浏览器，也能收发数据包，还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。功能强大，语法简洁优雅，代码量少，对新手友好。

爬虫反爬之5秒盾 - cloudflare

qq_33658268的博客

08-10

6155

爬虫反反爬之5秒盾 - cloudflare原创文章。

如何通过drissionpage过瑞数3/4/5/6/vmp各个版本的反爬视频+学习代码

十一姐的博客

04-30

2225

如何通过自动化过瑞数3/4/5/6/vmp版本的反爬

drissionpage爬虫自动化

01-02

### DrissionPage 爬虫自动化使用教程及案例 #### 1. DrissionPage 概述 DrissionPage 是一个基于 Python 的网页自动化工具，能够控制浏览器并收发数据包。该工具可以将浏览器自动化与请求发送相结合，在提供浏览器操作便利的同时保持高效的网络交互能力[^2]。 #### 2. SessionPage 和 ChromiumPage 功能对比 - **SessionPage**: 主要用于模拟 HTTP 请求，适合不需要渲染页面的任务。其性能较高，因为不涉及浏览器启动过程。 - **ChromiumPage**: 提供完整的浏览器环境支持 JavaScript 渲染等内容复杂的网站抓取工作。适用于需要处理动态加载内容的情况。 #### 3. 使用 SessionPage 爬取网易云音乐热歌榜实例下面是一个简单的例子来展示如何利用 `SessionPage` 来获取网易云音乐热门歌曲榜单的信息： ```python from drissionpage import SessionPage, config config.set_driver_path(r'path_to_chromedriver') # 设置 chromedriver 路径 url = 'https://music.163.com/discover/toplist?id=3779629' session_page = SessionPage() response = session_page.get(url) html_content = response.text print(html_content[:500]) # 打印前500字符查看部分HTML源码 ``` 这段代码通过设置 ChromeDriver 的路径初始化了一个新的会话对象，并向指定 URL 发送 GET 请求以获得 HTML 响应体的内容[^1]。 #### 4. 进一步解析和提取所需信息为了更深入地分析返回的数据，通常还需要借助 BeautifulSoup 或者 PyQuery 库来进行 DOM 解析，从而定位到具体的标签节点并抽取有用字段，比如歌曲名称、歌手名等。 ```python from bs4 import BeautifulSoup as soup parsed_html = soup(html_content, "lxml") song_list = parsed_html.find_all('div', class_='ttc') for song in song_list: title = song.a['title'] print(title) ``` 此段脚本展示了怎样运用 BeautifulSoup 对之前取得的 HTML 文档做进一步剖析，最终实现了对每首上榜曲目标题的有效读取。