- 博客(8)
- 收藏
- 关注
原创 瑞数6补环境案例(3)——吐环境脚本
本文介绍了一种针对瑞数6等前端防护的"吐环境脚本"调试方法。该脚本通过Proxy代理关键浏览器对象(如window、navigator、canvas等),自动记录目标脚本对这些对象属性的访问轨迹。作者分享了经优化的脚本源码(源自图灵Python),该版本精简了监听对象范围,输出格式清晰易读,能有效定位瑞数6检测的重点环境属性。文章强调该方法仅用于学习研究前端检测原理,严禁商业或非法用途。
2025-12-16 18:11:27
369
原创 某动漫网站视频js逆向爬取教程-以Scrapy为例
本文介绍了爬取动漫网站视频资源的完整流程。首先解决无限debugger问题,通过注入禁用代码优化调试体验。然后分析网页结构,使用Scrapy框架提取每集视频URL。重点解析了m3u8地址的获取过程:从网页静态数据中提取加密参数,通过逆向分析JavaScript代码定位到关键函数,最终成功解密获取真实m3u8地址。文章详细记录了逆向过程中的环境补全、函数导出等关键步骤,为视频资源爬取提供了完整的技术方案。
2025-12-07 20:25:03
3858
原创 瑞数6补环境案例(2)——后缀的补法
本文深入解析了瑞数6反爬机制中XHR重写与后缀生成的核心逻辑。作者指出,瑞数通过重写XMLHttpRequest.prototype.open方法实现后缀加密,关键在于提前构建XHR基础实现,为瑞数重写提供必要环境。文章详细阐述了XHR基础重写要点:必须返回URL、保留send方法占位,并需同步URL属性到location对象。通过分析实战代码,揭示了如何配合瑞数完成有效后缀生成,避免常见的400错误。最后强调,成功关键不在于破解加密,而是满足瑞数重写的依赖条件,包括正确返回URL和同步location属性
2025-11-25 15:10:39
1412
6
原创 瑞数6补环境案例(1)——某营业厅为例
文章摘要:本文以瑞数反爬为例,详细探讨了应对动态变化的JS反爬机制的方法。作者指出,学习反爬应注重思路而非固定案例,建议通过整合多篇文章的框架来构建完整解决方案。文章分析了目标站点的瑞数反爬核心流程,包括无限debugger、首次请求获取JS代码、生成关键Cookie等步骤,并提供了具体调试方法。重点演示了如何补足缺失的浏览器环境(如window、document、XMLHttpRequest等),通过联调与断点技术定位问题,最终生成有效Cookie。作者强调,面对不断变化的反爬机制,灵活调试和环境补齐是
2025-10-30 01:37:04
575
6
原创 针对强风控的另类解决方案-以某查查为例
本文分享了某查查平台低成本数据采集方案。该平台风控严格,存在参数加密、频率限制、IP检测和请求上限等问题。作者提出通过RPC工具(jsrpc)实现远程借号请求转发,结合租号池和轮询机制,有效分散单个账号请求压力。该方案利用web端自带加密逻辑,省去逆向环节,实测可稳定获取数十万数据。优点包括成本可控、风控规避效果好;但需维护号池,存在技术部署门槛和合规风险。建议对公开数据直接使用IP池采集,进一步降低成本。
2025-10-15 14:12:56
820
原创 RPC技术案例分析
oid大概就类似于视频的id,type、mode、plat和web_location也没啥加密空间了,pagination_str从经验来讲一般就是分页参数,第一页结束后相应内容中找到该str作为第二页的参数进行请求,那实际上我们需要解决的核心参数就是w_rid和wts。就是比较明显的请求参数了 a应该是一个加密的东西 从形式来讲大概率是一个特定格式的随机字符串 u的话看形式猜个差不多 基本就是时间戳 那情况很明了了 我们要的就是这个at函数吧 或者说要的就是return后的整个对象。
2025-09-03 02:30:22
1024
1
原创 某鱼网页版搜索结果爬取,逆向sign参数
本文聚焦某鱼网页版搜索结果爬取,重点逆向分析请求参数 `sign` 的生成逻辑。通过抓包发现更换页码后请求失败,对比参数确定 `t`(时间戳)和 `sign` 为关键验证参数。进一步逆向定位到 `sign` 由 `d.token`、时间戳、`appKey`、请求数据拼接后经自定义 MD5 函数计算生成,其中 `token` 从 cookie 的 `_m_h5_tk` 字段提取。最终通过 Python 调用 JS 代码实现参数生成,成功构造请求并搜索结果爬取,逆向sign参数
2025-05-10 14:37:13
2103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅