python爬虫逆向学习
文章平均质量分 90
已实战项目为线索,多个案例与相关知识文档结合对爬虫逆向技术进行深度的学习和掌握
半离岛
这个作者很懒,什么都没留下…
展开
-
python---协程与任务详解
之前爬虫使用的是requests+多线程/多进程,后来随着前几天的深入了解,才发现,对于爬虫来说,真正的瓶颈并不是CPU的处理速度,而是对于网页抓取时候的往返时间,因为如果采用requests+多线程/多进程,他本身是阻塞式的编程,所以时间都花费在了等待网页结果的返回和对爬取到的数据的写入上面。而如果采用非阻塞编程,那么就没有这个困扰。原创 2024-03-26 19:30:00 · 1221 阅读 · 0 评论 -
JS逆向---RSA登录模拟实例()
该文章是结合前一篇,测试例子是匀加速商城,登录状态下对其密码加密的逆向,比较简单容易上手,作为练习项目声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除,请各位自觉遵守相关法律法规。原创 2024-02-19 19:00:00 · 927 阅读 · 0 评论 -
JS逆向---常见加解密算法总结
基本算法,我们可以理解为分为两类:常见的不可逆取盐(数据摘要)算法盐,可以理解为数据摘要声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除,请各位自觉遵守相关法律法规。原创 2024-02-17 19:00:00 · 2308 阅读 · 0 评论 -
JS逆向---极验三代系列详解-最全流程(三)分析JS, w值参数生成最终值
原创文章,请勿转载!本文内容仅限于安全研究,不公开具体源码。维护网络安全,人人有责。JS逆向—极验三代系列详解-最全流程(一)分析接口,底图还原部分JS逆向—极验三代系列详解-最全流程(二)分析JS, w值参数生成-RSA算法部分JS逆向—极验三代系列详解-最全流程(三)分析JS, w值参数生成值最终值后续更新。原创 2024-02-04 19:00:00 · 2327 阅读 · 1 评论 -
JS逆向---极验三代系列详解-最全流程(二)分析JS, w值参数生成-RSA算法部分
原创文章,请勿转载!本文内容仅限于安全研究,不公开具体源码。维护网络安全,人人有责。JS逆向—极验三代系列详解-最全流程(一)分析接口,底图还原部分后续更新滑块验证码是我们在互联网上经常遇见的校验是否人类操作行为的一种检测方式,大概流程就是生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以及坐标等信息到后台进行校验。只要用户移动的距离符合,以及移动的轨迹行为检测通过即可视为验证通过。原创 2023-12-22 16:46:08 · 1826 阅读 · 0 评论 -
JS逆向---极验三代系列详解-最全流程(一)分析接口,底图还原部分
滑块验证码是我们在互联网上经常遇见的校验是否人类操作行为的一种检测方式,大概流程就是生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以及坐标等信息到后台进行校验。只要用户移动的距离符合,以及移动的轨迹行为检测通过即可视为验证通过。原创 2023-12-22 15:24:04 · 2051 阅读 · 0 评论 -
JS逆向---cookie反爬虫系列实战(加速乐-某蜂窝旅游攻略网站)
Cookie 反爬虫指的是服务器端通过校验请求头中的 Cookie 值来区分正常用户和爬虫程序的手段,这种手段被广泛应用在 Web 应用中。这次主要是对各类cookie值加密的网站情况进行分析学习响应cookie和session的处理学习基于首页返回的cookie值声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。原创 2023-10-21 17:00:00 · 1516 阅读 · 4 评论 -
JS逆向---cookie反爬虫系列(阿里系逆向-实战解析)
Cookie 反爬虫指的是服务器端通过校验请求头中的 Cookie 值来区分正常用户和爬虫程序的手段,这种手段被广泛应用在 Web 应用中。这次主要是对各类cookie值加密的网站情况进行分析学习响应cookie和session的处理学习基于首页返回的cookie值声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。原创 2023-10-18 20:10:45 · 3187 阅读 · 0 评论 -
JS逆向---cookie反爬虫破解技术实战案例分析(某地zf网站)
Cookie 反爬虫指的是服务器端通过校验请求头中的 Cookie 值来区分正常用户和爬虫程序的手段,这种手段被广泛应用在 Web 应用中。这次主要是对各类cookie值加密的网站情况进行分析学习响应cookie和session的处理学习基于首页返回的cookie值声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。原创 2023-10-14 17:00:00 · 2026 阅读 · 0 评论 -
JS逆向---多种方法对补环境操作-实例股票市场
该文章主要以一个股票网站为例,详解其cookie加密参数的补环境,也基本上是我做过到现在为至最难的一个补环境案例一般可以使用三种方法对其进行破解逆向1.selenium自动化对其flask框架进行补环境操作2.使用jsdow技术对其进行补环境3.proxy()脚本将其进行吐脚本操作,然后对其进行强行补环境该文章是用的方法三进行解析声明。原创 2023-09-26 17:30:00 · 1213 阅读 · 0 评论 -
JS逆向---补环境方法详解(DY X-Bogus参数)
今天这篇文章是针对dy网页端视频,评论区接口位置生成x_bogus参数,对该参数进行JS逆向分析,据我所知,其博主主页页面也是这个参数加密,其他页面还没有尝试过,应该也是可以的声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。原创 2023-09-21 17:00:00 · 3209 阅读 · 3 评论 -
JS逆向---补环境方法详解(案例一分析-今日头条)
该文章主要进行讲解遇到JSVMP情况下怎样进行补环境方法对JS部分进行逆向声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除,请各位自觉遵守相关法律法规。原创 2023-09-19 21:43:16 · 3572 阅读 · 0 评论 -
JS逆向---某某芯城实战案例
该逆向主要运用到的技术有AST解混淆,MD5魔改算法加密参数,使用的是eval()方法,需要解决签名认证即可进行逆向声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除,请各位自觉遵守相关法律法规。原创 2023-08-20 17:00:00 · 1042 阅读 · 0 评论 -
JS逆向---AST解混淆实战-极验验证码
本人写作水平有限,如有讲解不到位或者讲解错误的地方,还请各位大佬在评论区多多指教,共同进步.如有需要代码和讲解交流,可以加本人微信18847868809。对其进行AST解混淆后查找W值,会对我们的后续破解情况简单很多。如有需要相关极验验证码解混淆的相关代码和讲解交流,请与我联系。从启动器中进入,发现该JS部分为全部为混淆之后的情况。但我们本章内容只学习解混淆部分,所以对此不进行考虑。找到数据接口,发现该部分载荷加密部分为w值。原创 2023-08-20 09:18:53 · 1015 阅读 · 1 评论 -
JS逆向---令人抓狂的JavaScript混淆技术
JavaScript 压缩、混淆和加密技术JavaScript 代码运行于客户端,也就是它必须要在用户浏览器端加载并运行。JavaScript 代码是公开透明的,也就是说浏览器可以直接获取到正在运行的 JavaScript 的源码。声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!原创 2023-08-16 17:00:00 · 7190 阅读 · 3 评论 -
JS逆向---webpack专题讲解
webpack是一个现代的前端打包工具,它的主要作用是将多个模块打包成一个或多个静态资源文件。通过配置webpack,我们可以定义入口文件和出口文件,使用插件和加载器来处理不同类型的文件,以及设置开发模式和使用webpack开发服务器。[1][2]使用webpack可以实现模块化开发,提高前端项目的开发效率和性能。对于webpack的配置项,我们需要了解入口和出口的设置,插件和加载器的使用,以及开发模式和webpack开发服务器的运作过程。声明。原创 2023-08-04 17:00:00 · 2761 阅读 · 5 评论 -
JS逆向---非对称加密对抗(RSA,DSA详解以及案例分析)
与对称加密算法不同,非对称加密算法需要两个密钥:公开密钥(publickey)和私有密钥(privatekey)。公开密钥与私有密钥是一对,如果用公开密钥对数据进行加密,只有用对应的私有密钥才能解密;如果用私有密钥对数据进行加密,那么只有用对应的公开密钥才能解密。因为加密和解密使用的是两个不同的密钥,所以这种算法叫作非对称加密算法。声明。原创 2023-07-25 17:00:00 · 2690 阅读 · 0 评论 -
JS逆向---对称加密算法(DES, AES详解以及案例分析)
对称式加密就是加密和解密使用同一个密钥。信息接收双方都需事先知道密匙和加解密算法且其密匙是相同的,之后便是对数据进行加解密了。对称加密算法用来对敏感数据等信息进行加密。DES:56位密钥,由于密钥太短,被逐渐被弃用。AES:有128位、192位、256位密钥,现在比较流行。密钥长、可以增加破解的难度和成本。工作模式归纳ECB模式 全称Electronic Codebook模式,译为电子密码本模式,每个数据块独立进行加/解密。原创 2023-07-22 17:00:00 · 7781 阅读 · 0 评论 -
JS逆向---国标哈希算法(MD5,SHA系列,HMAC加密以及相关案例详解)
在 JavaScript 中和 Python中的基本实现方法,遇到 JS 加密的时候可以快速还原加密过程,有的网站在加密的过程中可能还经过了其他处理,但是大致的方法是一样的。本篇文章主要讲述内容:消息摘要算法/安全哈希算法/散列消息认证码、密钥相关的哈希运算消息认证码:MD5、SHA、HMAC声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!原创 2023-07-19 17:00:00 · 2463 阅读 · 0 评论 -
scrapy框架---学习
掌握 虚拟环境的搭建了解 scrapy的概念掌握 scrapy框架的运行流程应用 解析并获取scrapy爬虫中的数据应用 scrapy管道的基本使用了解 scrapy debug信息了解 scrapy shell的使用掌握 scrapy的settings.py设置掌握 scrapy管道(pipelines.py)的使用官方文档地址:https://www.osgeo.cn/scrapy/intro/install.html。原创 2023-07-14 17:00:00 · 401 阅读 · 1 评论 -
IP代理池的搭建(案例---某马逊实战爬虫)
使用ip的作用和原因首先代理ip可以保护用户信息的安全。在如今的大数据互联网时代,每个人上网总会留下一点信息,很有可能被别人利用,而使用代理ip可以完美解决这个问题。高匿名代理ip可以隐藏用户的真实ip地址,保护用户的个人数据和信息安全,提高用户上网的安全性。其次可以提高访问速度,有时出现过访问网页时出现卡顿的问题,通过代理ip一定程度上可以解决这个问题。通过代理IP访问的一些网站等信息会存留在代理服务器的缓冲区内,假如别人访问过的信息你再访问,则会直接在缓冲区内拉取数据,进一步提高访问速度。原创 2023-07-09 12:17:25 · 1004 阅读 · 2 评论 -
爬虫 + 自动化利器---selenium详解以及实战项目
什么是seleniumSelenium是一个用于Web应用程序测试的工具。只要在测试用例中把预期的用户行为与结果都描述出来,我们就得到了一个可以自动化运行的功能测试套件。Selenium测试套件直接运行在浏览器中,就像真正的用户在操作浏览器一样。Selenium也是一款同样使用Apache License 2.0协议发布的开源框架。Selenium工具的主要功能包括:测试程序与浏览器的兼容性,测试你的应用程序是否能够很好得工作在不同浏览器和操作系统之上。原创 2023-07-01 18:09:44 · 8572 阅读 · 4 评论 -
高性能爬虫实现 --- 使用多线程/线程池/多进程/异步协程(包含多个不同爬虫示例进行学习)
对于正常单线程爬虫,速度很慢。通过本节的学习,我们会掌握如何实现更高效的爬虫,主要有多线程,线程池,多进程,异步协程等方法声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除!原创 2023-06-27 17:00:00 · 2186 阅读 · 5 评论