༒࿈南林࿈༒-CSDN博客

原创喜马拉雅音频数据采集

{"reqId":"53712be1-100894685","ret":1001,"msg":"系统繁忙，请稍后再试!作为关键字搜索，有人可能要问了为哈要用它呢，因为url实在playUrlList里面，点击媒体过滤后看到音频，但是通过网址中的字段进行搜索并没有数据，只有网址本身的返回。所以先请求得到响应数据，从数据中获取url的密文进行解密后再获取音频数据。因为喜马拉雅的网页有检查，如果在当前网页打开开发者工具，会加载不出数据。取到密文，u取到密文给到 "l",然后传入，进行解密。

2026-03-31 22:27:59 39

原创基于DrissionPage前程无忧数据采集、数据分析及其可视化

摘要：本文介绍了DrissionPage工具的基本用法，包括数据采集、验证处理等技术要点。重点说明了如何通过打码平台或官方验证处理解决滑块验证问题，以及实现翻页采集的方法（定位翻页元素）。文末提供了DrissionPage官方文档链接（https://www.drissionpage.cn/）供参考，并强调分享内容仅供学习交流，禁止用于违法违规用途。

2026-03-30 23:31:04 11

原创乐通登录滑块

网址：IGh0dHBzOi8vd3d3LmxvZnRlci5jb20vZnJvbnQvbG9naW4v。

2026-03-29 23:32:24 29

原创 1688网站数据采集

摘要：本文介绍了从1688网站批量采集商品信息的技术流程。首先通过开发者工具分析网页数据来源，发现第一页为静态页面，后续页面通过动态接口获取。然后详细说明了代码实现的四个步骤：发送请求模拟浏览器访问、获取服务器响应数据、解析提取所需信息、以及保存到本地文件。需要注意的是，不同页面的数据获取方式不同，建议直接从第二页开始搜索以避免静态页面限制。整个过程展示了网页数据采集的基本方法和技术要点。

2026-03-28 10:33:19 284

原创一号店js逆向（用户名、密码、滑块）

本文分析了某网站登录参数加密过程，重点解析了用户名、密码和验证码参数的加密方式。通过逆向工程发现，用户名和密码通过JSEncrypt进行加密，验证码token由三部分（as+ap+aq）用"|"连接组成。文章详细追踪了加密参数的来源，包括断点调试、控制台输出等方法，最终确认了各加密参数的生成逻辑。同时提到滑块验证参数由sceneId、data、s等动态参数组成，并指出验证通过后的加密参数可在请求中获取。该分析为技术研究提供了详细的逆向思路，但强调仅供学习用途。

2026-03-26 21:22:59 23

原创中国裁判文书网案例批量爬取

本文介绍了某法院网站数据采集的技术研究过程，主要包含JS逆向分析和数据解密方法。通过开发者工具分析发现页面数据经过加密处理，重点研究了ciphertext等加密参数的生成逻辑。文章详细记录了定位加密函数、扣取加密代码、解密数据处理的全流程，并验证了解密方法的有效性。研究过程中强调了技术使用的法律边界，明确声明仅用于合法技术研究，禁止任何非法数据爬取行为。最终实现了加密数据的成功解密，并解释了各请求参数的作用，为后续数据清洗和存储奠定了基础。

2026-03-26 09:34:53 472

原创【验证码逆向】腾讯滑块

纯小白，若有什么不对之处，大家多多海涵，大家可以在评论区雅正，其次本文只做技术分享不做商业用途，文章中所有内容仅供学习交流使用，不用于其他任何目的，不提供完整代码，严禁用于商业用途和非法用途，否则由此产生的一切后果均与本文及作者无关，很多东西都是站在很多前辈肩上去学习的，再次恳请各位佬手下留情~

2026-01-03 23:03:39 1327

原创慕课网Python登录

本文分析了慕课网登录功能的密码加密机制。研究发现密码通过RSA算法加密，使用JavaScript实现的K函数进行公钥加密处理。加密过程涉及时间戳和Base64编码，最终将加密结果赋值给password字段。作者提供了验证码识别和密码加密的Python实现代码，使用ddddocr库处理验证码，通过调用JavaScript代码完成密码加密。该分析为纯技术分享，旨在帮助理解登录加密流程，不涉及商业用途。

2026-01-02 22:34:20 332

原创爬取七猫中文网小说

本文介绍了一个爬取七猫中文网小说的Python实现方案。通过分析网站结构发现，每本小说都有唯一ID，章节内容可通过chapter-list接口获取。代码实现了以下功能：1)通过书名搜索获取书籍ID；2)自动创建书籍目录；3)按章节顺序下载小说内容并保存为txt文件。程序会显示搜索结果供用户选择，并自动处理URL编码、非法字符等问题。使用requests库获取数据，lxml解析HTML，最终将章节内容按顺序存储到本地。该方案支持用户输入书名即可完成整本小说的下载，无需手动处理书籍ID。

2026-01-01 18:53:26 854

原创中国某油某标某标网

本文分享了抓取中国石油招标网站(https://www.cnpcbidding.com)数据的爬虫实现方案。通过分析发现网站采用Base64加密和RSA非对称加密，公钥私钥存储在localStorage中。实现过程包括：1)从CSS文件获取加密密钥；2)处理可能出现的验证码；3)使用JSEncrypt库进行RSA解密；4)对返回的密文数据进行Base64解码。文章提供了Python实现的关键代码片段，包括密钥获取、验证码处理和加解密过程，并强调仅供学习参考，禁止商业用途。最后提醒注意数据使用范围和隐私保护等

2025-12-28 16:26:08 299

原创某狐邮箱登录

本文分析了搜狐邮箱登录接口的加密机制。通过抓包发现密码采用MD5加密，同时需要获取动态jv参数。文章详细介绍了如何获取jv值的方法：先获取通用cookie，再通过接口获取js代码并执行以提取jv。此外，提供了完整的MD5加密函数实现，可用于密码加密处理。最后指出模拟登录的关键在于正确处理jv和MD5加密这两个环节。整个过程展示了从接口分析到具体实现的完整思路。

2025-12-28 10:45:44 587

2303_80825459的博客