- 博客(11)
- 收藏
- 关注
原创 喜马拉雅音频数据采集
{"reqId":"53712be1-100894685","ret":1001,"msg":"系统繁忙,请稍后再试!作为关键字搜索,有人可能要问了为哈要用它呢,因为url实在playUrlList里面,点击媒体过滤后看到音频,但是通过网址中的字段进行搜索并没有数据,只有网址本身的返回。所以先请求得到响应数据,从数据中获取url的密文进行解密后再获取音频数据。因为喜马拉雅的网页有检查,如果在当前网页打开开发者工具,会加载不出数据。取到密文,u取到密文给到 "l",然后传入,进行解密。
2026-03-31 22:27:59
39
原创 基于DrissionPage前程无忧数据采集、数据分析及其可视化
摘要:本文介绍了DrissionPage工具的基本用法,包括数据采集、验证处理等技术要点。重点说明了如何通过打码平台或官方验证处理解决滑块验证问题,以及实现翻页采集的方法(定位翻页元素)。文末提供了DrissionPage官方文档链接(https://www.drissionpage.cn/)供参考,并强调分享内容仅供学习交流,禁止用于违法违规用途。
2026-03-30 23:31:04
11
原创 1688网站数据采集
摘要:本文介绍了从1688网站批量采集商品信息的技术流程。首先通过开发者工具分析网页数据来源,发现第一页为静态页面,后续页面通过动态接口获取。然后详细说明了代码实现的四个步骤:发送请求模拟浏览器访问、获取服务器响应数据、解析提取所需信息、以及保存到本地文件。需要注意的是,不同页面的数据获取方式不同,建议直接从第二页开始搜索以避免静态页面限制。整个过程展示了网页数据采集的基本方法和技术要点。
2026-03-28 10:33:19
284
原创 一号店js逆向(用户名、密码、滑块)
本文分析了某网站登录参数加密过程,重点解析了用户名、密码和验证码参数的加密方式。通过逆向工程发现,用户名和密码通过JSEncrypt进行加密,验证码token由三部分(as+ap+aq)用"|"连接组成。文章详细追踪了加密参数的来源,包括断点调试、控制台输出等方法,最终确认了各加密参数的生成逻辑。同时提到滑块验证参数由sceneId、data、s等动态参数组成,并指出验证通过后的加密参数可在请求中获取。该分析为技术研究提供了详细的逆向思路,但强调仅供学习用途。
2026-03-26 21:22:59
23
原创 中国裁判文书网案例批量爬取
本文介绍了某法院网站数据采集的技术研究过程,主要包含JS逆向分析和数据解密方法。通过开发者工具分析发现页面数据经过加密处理,重点研究了ciphertext等加密参数的生成逻辑。文章详细记录了定位加密函数、扣取加密代码、解密数据处理的全流程,并验证了解密方法的有效性。研究过程中强调了技术使用的法律边界,明确声明仅用于合法技术研究,禁止任何非法数据爬取行为。最终实现了加密数据的成功解密,并解释了各请求参数的作用,为后续数据清洗和存储奠定了基础。
2026-03-26 09:34:53
472
原创 【验证码逆向】腾讯滑块
纯小白,若有什么不对之处,大家多多海涵,大家可以在评论区雅正,其次本文只做技术分享不做商业用途,文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,严禁用于商业用途和非法用途,否则由此产生的一切后果均与本文及作者无关,很多东西都是站在很多前辈肩上去学习的,再次恳请各位佬手下留情~
2026-01-03 23:03:39
1327
原创 慕课网Python登录
本文分析了慕课网登录功能的密码加密机制。研究发现密码通过RSA算法加密,使用JavaScript实现的K函数进行公钥加密处理。加密过程涉及时间戳和Base64编码,最终将加密结果赋值给password字段。作者提供了验证码识别和密码加密的Python实现代码,使用ddddocr库处理验证码,通过调用JavaScript代码完成密码加密。该分析为纯技术分享,旨在帮助理解登录加密流程,不涉及商业用途。
2026-01-02 22:34:20
332
原创 爬取七猫中文网小说
本文介绍了一个爬取七猫中文网小说的Python实现方案。通过分析网站结构发现,每本小说都有唯一ID,章节内容可通过chapter-list接口获取。代码实现了以下功能:1)通过书名搜索获取书籍ID;2)自动创建书籍目录;3)按章节顺序下载小说内容并保存为txt文件。程序会显示搜索结果供用户选择,并自动处理URL编码、非法字符等问题。使用requests库获取数据,lxml解析HTML,最终将章节内容按顺序存储到本地。该方案支持用户输入书名即可完成整本小说的下载,无需手动处理书籍ID。
2026-01-01 18:53:26
854
原创 中国某油某标某标网
本文分享了抓取中国石油招标网站(https://www.cnpcbidding.com)数据的爬虫实现方案。通过分析发现网站采用Base64加密和RSA非对称加密,公钥私钥存储在localStorage中。实现过程包括:1)从CSS文件获取加密密钥;2)处理可能出现的验证码;3)使用JSEncrypt库进行RSA解密;4)对返回的密文数据进行Base64解码。文章提供了Python实现的关键代码片段,包括密钥获取、验证码处理和加解密过程,并强调仅供学习参考,禁止商业用途。最后提醒注意数据使用范围和隐私保护等
2025-12-28 16:26:08
299
原创 某狐邮箱登录
本文分析了搜狐邮箱登录接口的加密机制。通过抓包发现密码采用MD5加密,同时需要获取动态jv参数。文章详细介绍了如何获取jv值的方法:先获取通用cookie,再通过接口获取js代码并执行以提取jv。此外,提供了完整的MD5加密函数实现,可用于密码加密处理。最后指出模拟登录的关键在于正确处理jv和MD5加密这两个环节。整个过程展示了从接口分析到具体实现的完整思路。
2025-12-28 10:45:44
587
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅