自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 js逆向绕过指纹识别

curl_cffi 明确支持 Windows 平台,并提供了预编译的安装包。其核心功能(如浏览器指纹模拟、HTTP/2 支持)在 Windows 上与 Linux/macOS 表现一致。• curl_cffi 0.7+ 版本修复了早期版本(如 0.6)的 Windows TLS 指纹错误。部分 Windows 环境需以管理员身份运行终端,否则可能因权限问题安装失败。• Python 3.8 及以上版本(推荐 Python 3.10+)。• 解决:升级到 0.7+ 版本,并确保。

2025-05-04 22:00:43 598

原创 爬虫准备前工作

网址:PyCharm: The only Python IDE you need网址:python.org(python3.9版本之后都可以)网址:Node.js — 在任何地方运行 JavaScript(版本使用18就可以)网址:Convert curl commands to code(复制网址的curl写简单的request)6.Proxy补环境监听7. webpack细节 开头进行补环境 window = global (先运行,看哪些环境需要进行补) 在加载函数

2025-05-03 17:43:12 1898

原创 js逆向:管家婆登录案例

声明:本文章中所有内容仅供学习交流使用,不用于其他任何目的,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!1.分析网站。

2025-04-24 20:45:17 712

原创 js逆向:烯牛数据

本文章中所有内容仅供学习交流使用,不用于其他任何目的,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 最后我们对加密数据进行了破解 总结:最后我们进行代码归整 js代码如下(只提供图片,不提供源代码):

2025-04-24 15:52:34 707

原创 Hook插件

通过使用hook,开发者可以在现有的函数执行前、执行后或者替换函数的实现逻辑。一些网站会严格检测该网站中的先关函数或者属性是否被一些别有用心的人进行hook。atob函数是浏览器环境自带的用来对base64数据进行解编码。4.在Sources中的Snippets代码段中新增hook代码片段,打上断点,然后运行。结果:两个atob的toString返回的结果是不一样的。5.查看hook运行,监控atob函数的执行。原型链上的toString()检测法的破解。toString() 检测法的破解。

2025-04-17 20:13:02 702

原创 js逆向:电子公共交易平台

放到js文件中进行调试(先运行代码,哪里不合适就去浏览器观察,缺什么就补什么,然后将Data搬过来进行测试)和上述操作一样,进行断点,但是不同的是我们需要将解密的这一段复制过来,放到js文件中模拟它解码。key关键字:portal-sign(请求解密中可以使用到)方法关键字:encrypt(加密)、decrypt(解密)将找到的代码,复制到我们创建的js文件中,进行调试。将它放到我们的python中运行。请求堆栈:主要是针对请求逆向。headers关键字。

2025-04-15 21:06:09 1647

原创 常见的爬虫算法

DES全称为Data Encryption Standard,即数据加密标准,是一种使用密钥加密的算法。该加密算法是一种对称加密方式,其加密运算、解密运算需要使用的是同样的密钥(一组字符串)即可。当原始数据凑不够三个字节时,编码结果中会使用额外的**符号“=”**来表示这种情况。,然后根据Base64的对应表,得到对应的编码数据。Base64编码的基本思路是。

2025-04-15 21:00:17 2166

原创 DrissionPage详细教程

DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能像requests一样收发数据包,更重要的是还能把两者合二为一。因此,简单来说DrissionPage可兼顾浏览器自动化的便利性和 requests 的高效率。DrissionPage功能强大,内置无数人性化设计和便捷功能。并且它的语法简洁而优雅,代码量少,对新手友好。

2025-04-13 21:40:47 1137

原创 爬虫:IP代理

有些时候,需要对网站服务器发起高频的请求,网站的服务器会检测到这样的异常现象,则会讲请求对应机器的ip地址加入黑名单,则该ip再次发起的请求,网站服务器就不在受理,则我们就无法再次爬取该网站的数据。使用代理后,网站服务器接收到的请求,最终是由代理服务器发起,网站服务器通过请求获取的ip就是代理服务器的ip,并不是我们客户端本身的ip。高匿:网站服务器不知道你使用了代理,也不知道你的真实ip(推荐)透明:网站的服务器知道你使用了代理,也知道你的真实ip。https:可以转发https协议的请求。

2025-04-13 21:36:27 914

原创 js逆向:瑞数

声明:本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!1. 瑞舒介绍瑞数动态安全 Botgate(防火墙)以“动态安全”技术为核心,通过动态封装、动态验证、动态混淆、动态令牌等技术对服务器网页底层代码持续动态变换,增加服务器行为的“不可预测性”,实现了从用户端到服务器端的全方位“主动防护”,为各类 Web、HTML5 提供强大的安全保护。

2025-04-10 17:12:17 1690

原创 sha1算法

【代码】sha1算法。

2025-04-09 21:43:44 125

原创 python爬虫:喜马拉雅案例(破解sign值)

代码如下:var e = "")))),e// 测试nonce: t});

2025-04-09 20:30:20 1148 1

原创 python爬虫:喜马拉雅登录案例

这里我们就有一个小问题,我么先定义,在调用,所以我们就应该把__award_library__这个放到mod1文件中,把之前的mod1改成mod2,先调用再执行(注意要把var去掉改成全局的)

2025-04-06 22:31:17 1155

原创 python爬虫:DrissionPage实战教程

前提:我们以ChromiumPage为主,写代码工具使用Pycharm(python环境3.9-3.10)注意:学习为主,不要大量爬取数据,妨碍网站的运行,造成法律问题,需本人自己承担。

2025-04-05 16:35:49 527

原创 爬虫自动化工具:DrissionPage

它摆脱了对 Selenium 的依赖,从 3.0 版本开始,作者另起炉灶,用 chromium 协议自行实现了类似 Selenium 的全部功能,并且在此基础上增加了许多独特的特性。总之,DrissionPage 以其独特的设计理念和不断创新的精神,在自动化爬虫领域逐渐崛起,为开发者带来了全新的体验和更多的可能性。但从 3.0 版开始,作者另起炉灶,用 chromium 协议自行实现了 selenium 全部功能,从而摆脱了对 selenium 的依赖,功能更多更强,运行效率更高,开发更灵活。

2025-04-05 16:06:07 1973

原创 python爬虫:小程序逆向实战教程

(注意:不要干扰小程序的正常运行,违法行为)

2025-04-04 16:14:12 4591 8

原创 python爬虫:小程序逆向(需要的工具前期准备)

unpackminiapp主要用于解密微信小程序的.wxapkg文件,将其转换为可以进一步反编译的格式。该工具能够自动解密小程序包,并将解密后的文件存储在指定的文件夹中,供后续步骤使用。如果要解密多个文件,则需要对解密后的文件依次进行重命名。因为该工具对解密后的每一个文件的命名是一致的,不重新命名会产生文件覆盖。使用unveilr可以直接通过命令行对.wxapkg文件进行反编译,并将结果输出到指定的文件夹中。在使用该工具时,需要在该工具同级目录下。,用于存储解密后的wxapkg文件。

2025-04-03 16:24:14 1428

原创 逆向爬虫之补环境

当我们辛苦将浏览器环境的加密或者解密入口找到,把加密或者解密的JS的代码拷贝到本地,由node解释器驱动执行的时候,会因为拷贝的JS代码中包括只能由浏览器调用的API,现在被node执行就会报错,为了解决这个问题,我们需要在拷贝的代码环境中模拟补充需要的前端对象,所以我们就非常有必要掌握浏览器接口对象常用的==八大前端对象==在这里,整层的JS加密代码对于我们而言就是一个黑匣子,有千千万万行代码,甚至做了混淆处理,我们不能去一行行读,看看整个过程到底用到了哪些对象以及对应的属性和方法的。

2025-04-01 16:23:50 1968

原创 爬虫案例:使用webpack爬取批量数据

网站地址:(有基础的可以看懂网址)aHR0cHM6Ly93d3cuZGlnaWtleS5jbi96aC9wcm9kdWN0cy9maWx0ZXIvY29heGlhbC1jYWJsZXMtcmYvNDc1P3M9TjRJZ3JDQmNvQTVRTEFHaERPa0JNWUMlMkJXZw==

2025-03-31 19:17:15 1717

原创 爬虫中遇到的解码问题

在爬虫中,会遇到解码的问题,首先我尝试通过response.encoding = 'utf-8'还有response.encoding = 'gbk',两种方式去解决,但是没有解决。最后使用下面这段代码解决,这段代码是,我先进行代码gbk加密,然后再解密(可能是网站那边有些没有加密成gbk,我们解不开,所以报错;'\xb2'识别了的问题)

2025-03-29 15:26:33 860

原创 js逆向爬虫中:webpack注意事项

webpack

2025-03-27 17:35:30 891

转载 Matplotlib模块

在数据可视化、统计绘图和图表生成领域,Python 被广泛使用,其中 Matplotlib 是一个极其重要的基础三方库。本博客旨在介绍 Python 及其三方库 Matplotlib 的详细信息,包括 Matplotlib 的安装步骤、示例代码及使用注意事项。Matplotlib 是一个 Python 2D 绘图库,能生成各种形式的图表,包括折线图、柱状图、饼图、散点图等。Matplotlib 是数据分析和科研绘图中不可或缺的工具之一,广泛用于数据展示、分析结果可视化和报告生成.

2024-06-21 16:50:34 99

原创 pandas模块

首先先来认识pandas中的两个常用的类SeriesDataFrame索引:df[col]:取列df.loc[index]:取行df.iloc[index,col]:取元素切片:df[index1:index3]:切行df.iloc[:,col1:col3]:切列。

2024-05-29 19:01:11 920

原创 numpy模块

【代码】numpy模块。

2024-05-27 21:34:30 662 1

原创 MySQL数据库的安装

【代码】MySQL数据库的安装。

2024-01-16 22:02:28 308

原创 函数的嵌套(比较四个数的大小)

【代码】函数的嵌套(比较四个数的大小)

2023-11-13 21:36:13 220

原创 函数对象案例(银行案例)

【代码】函数对象案例(银行案例)

2023-11-12 19:57:57 335 1

原创 Day14:函数对象

精髓:可以把函数当成变量去用(func = 内存地址)

2023-11-11 14:59:12 180 1

原创 Day13:global和nonlocal

【代码】Day13:global和nonlocal。

2023-11-10 18:26:20 82 1

原创 Day12:名称空间与作用域

1.1.6 名字的查找优先级:当前所在位置向上一层一层查找(就近原则,且依次向外查找,但是名称空间是独立不同的)1.1.4 名称空间的加载顺序。1.1.1 内置名称空间。1.1.2 全局名称空间。1.1.3 局部名称空间。1.1.5 销毁顺序。

2023-11-10 18:12:43 81 1

原创 Day11:函数的基本使用

函数相当于具备一个功能的工具函数的使用必须遵循一个原则:先定义,后调用三种定义方式。

2023-11-06 16:58:13 73

原创 python中文件的使用

with语句用来访问文件,with( r '文件的路径',mode='内外模式的运用',encoding = '编码模式的格式')

2023-11-01 20:02:18 181 1

原创 解决python版本中乱码问题、以及编码、解码

【代码】解决python版本中乱码问题、以及编码、解码。

2023-10-28 15:03:38 282 1

原创 操作系统:多道技术

看起来像同时运行的就可以称之为并发(事件A执行完再去在执行B,A和B分开执行)例子:洗衣服30min、做饭50min、烧水30min。单道需要110min,多道只需要最长时间的那一个。真正意义上的同时执行(事件A和B同时执行)多个程序共用一套计算机硬件。

2023-10-26 18:55:21 191

原创 Day10:for循环

while循环称为条件循环,循环次数取决于条件何时变为假for循环称之为"取值",循环次数取决于in包含的值的个数。

2023-10-26 18:21:00 119

原创 Day09:while循环

【代码】Day09:while循环。

2023-10-22 20:45:42 60 1

原创 Day08: if 判断

【代码】Day08: if 判断。

2023-10-21 10:45:20 66 1

原创 Day07 : 浅拷贝和深拷贝

浅拷贝:只进行对栈区的拷贝,不拷贝堆区的内容;言外之意就是,只拷贝它堆区里面的地址。而且,它对可变与不可变类型不区分。深拷贝:对栈区和堆区的内容都进行拷贝;言外之意就是,它的值和它的地址都进行拷贝。但是它对可变与不可变进行区分,可变会改变之前的地址,不可变不会改变之前的地址。

2023-10-20 19:02:49 55 1

原创 Day06:运算符(补充)、可变、不可变

1. 两者的定义: 2. 两者的范围: 3. 字典的拓展:

2023-10-19 19:46:48 62

原创 Day05:Python基础运算符

【代码】Day05:Python基础运算符。

2023-10-14 16:57:34 100 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除