番茄小说逆向爬取

最新推荐文章于 2025-04-03 10:51:52 发布

JUNAI_Strive_ving

最新推荐文章于 2025-04-03 10:51:52 发布

阅读量1.9k

点赞数 7

分类专栏：爬虫逆向文章标签： python javascript

本文链接：https://blog.csdn.net/SM_zeng/article/details/142707057

版权

爬虫逆向专栏收录该内容

8 篇文章

订阅专栏

前言：

之前有人向我请教番茄小说的爬虫，这不就是ab参数加一个字体加密吗

首先ab参数

就在这里生成，之前讲过不细讲，注意参数是什么就行

然后是字体加密，

可以先讲字体文件处理为图片

然后使用ddddocur来处理图像识别

可以看这个，注意这个可能要稍微改一下，因为我python是3.11，里面一些些东西不能用，所以换了写法才正常的

python 爬虫遇到字体加密解决方案(woff2) ddddocr + 百度ocr 文字识别_python解决woff字体加密-CSDN博客

当然番茄的字体加密是静态，如果你牛可以一个个自己手写json

这样就完成了啊，这个不仅仅是woff2可以用，woff和ttf都行，如果懒得分析，可以就用图像识别，傻瓜式过字体加密

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JUNAI_Strive_ving

关注关注

7
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python实战项目40--采集番茄小说网小说

lyccomcn的博客

10-11

5009

数据提取使用的是python的第三方库parsel。找到数据接口，为网页文件。

基于python+django的爬取番茄小说数据及可视化系统设计与实现大数据分析系统(源码+lw+部署文档+讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导,高校老师/讲师/同行合作。以及产品测评宣传、工具推广等合作。全网粉丝30万+,CSDN特邀博主,Java新星计划多届导师,掘金/知乎/华为云/阿里云/51CTO等平台优质创作者。

10-07

1907

💗博主介绍：✌计算机全栈开发工作室，接各类程序定制开发，有需要的滴滴✌💗主要内容：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。✌💗👇🏻精彩专栏推荐订阅👇🏻🌟文末获取源码+数据库🌟。

参与评论您还未登录，请先登录后发表或查看评论

番茄小说爬虫小项目（广告太烦人了，一键导入微信读书.zip

01-20

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。请求网页：爬虫使用HTTP或其他协议向目标URL发起请求，获取网页的HTML内容。这通常通过HTTP请求库实现，如Python中的Requests库。解析内容：爬虫对获取的HTML进行解析，提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据，如文本、图片、链接等。数据存储：爬虫将提取的数据存储到数据库、文件或其他存储介质中，以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。遵守规则：为避免对网站造成过大负担或触发反爬虫机制，爬虫需要遵守网站的robots.txt协议，限制访问频率和深度，并模拟人类访问行为，如设置User-Agent。反爬虫应对：由于爬虫的存在，一些网站采取了反爬虫措施，如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。爬虫在各个领域都有广泛的应用，包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而，使用爬虫需要遵守法律和伦理规范，尊重网站的使用政策，并确保对被访问网站的服务器负责。

某小说App返回数据解密分析

fenfei331的博客

06-13

2804

李老板：奋飞呀，最近被隔离在小区里，没啥可干的呀。奋飞：看小说呀，量大管饱。我们今天的目标就是某小说App v2021_09_53App请求小说内容的时候没有加签名，但是返回的数据是加密的。那么我们先去jadx搜索一下这个url(novel-content)，看看有没有发现。结果是没有收获。那么很有可能这个url不是在apk中写死的，而是某个请求返回的。Charles可以搜索数据包，我们从返回包里面找到了这个url。那就好办了，看看是哪块代码去解析了这个 content_url ，我们在jadx中搜索“co

【python】简单小说爬取

热门推荐

玩机科技社的博客

02-21

1万+

安卓抓包：https://i-hl.snssdk.com/luckycat开头的，在cookie里面找到sessionid，在url里面找到iid和device_id，将sessionid#iid#device_id填入变量，多账号@隔开。苹果抓包：https://i.snssdk.com/开头的，在cookie里面找到sessionid，在url里面找到iid和device_id，将sessionid#iid#device_id填入变量，多账号@隔开。⚠️多账号一定不要在同一台设备抓Ck!

(Python爬虫)番茄小说-《超级上门女婿》

qq_66640856的博客

06-03

6285

本文从爬虫案例出发，以爬取番茄小说网站中小说为例，详细介绍了网络爬虫的四个基本步骤：发送请求、获取数据、解析数据以及保存数据。首先，我们需要了解如何通过编写代码来发送HTTP请求与目标网站建立通信，并如何通过设置请求头，包括用户代理（User-Agent）、认证令牌（Tokens）、Cookies等信息来绕过网站的安全措施。接着，说明如何获取服务器响应的数据，并使用如parsel这类的HTML解析器，根据HTML文档结构提取有用信息。最后，讨论了数据的保存方法，包括存储格式的选择和数据处理的注意事项。

自学爬虫第三天，番茄小说(文字加密)

Myc970223的博客

08-17

3531

学习爬虫的时候，会遇到各种各样的加密，对于番茄来说，它的加密主要体现在文字上，也是平常所说的文字加密。文字加密是网站的一种常用的反爬手段，会让提取的内容不能正确的显示出来。以上就是今天要讲的内容，文字加密是的一种最简单反爬机制，只有两套编码，多的三四套也是有的，这样就更麻烦了。在保证能把内容爬下来的前提下，再去分析内容是否有问题，有问题一层一层的解决问题。

青龙面板番茄小说薅羊毛

醉里博客202271.xyz

03-09

8082

脚本下载https://wwi.lanzoup.com/ilFcL0ot8s1g。sessionid值在请求里面往下拉。任务定时0 */5 * * *?注: 多个账号不要在同一台设备抓。注: 多个账号不要在同一台设备抓。注: 多个账号不要在同一台设备抓。直接搜索出来了域名一个一个找。没搜到就重新抓十几条数据再搜索。番茄免费小说商店应用下载！抓包数据请看脚本说明以及教程。指定域名i-hl不好抓了话。每天定时5分钟自动跑一次。就直接搜索ck值关键词。新建任务好后定时起飞。did值在url里面。

青龙脚本（番茄小说，附脚本）（已废）

weixin_49808708的博客

03-22

1万+

青龙脚本（番茄小说，附脚本）

小说推文之小说内容获取，即小说网站爬取（爬虫遇到字体加密）

qq_16900759的博客

02-18

2089

最近尝试挖掘小说推文领域，发现有好多都需要整理，且内容较多，本次就因为平台没有给小说章节内容，需要手动去小说网站复制，而且最诡异的是网站上不支持复制，而手机只能一页一页的复制，像一个章节就包含了好几页，这样大大的增加了操作难度，因本身具有python基础，故想到了利用爬虫去获取小说内容，话不多说，我们直接开始，一步一步进行探索。第三步，采用ddddocr进行图片识别，内容有部分错误，需手动调节，总体错误率不是太高，因识别率再高需要收费，且识别率有多高尚需验证。第七步，爬取每一章节内容。

python 爬虫破解字体加密反爬技术(大众点评为例)

python_HJC的博客

03-09

2270

2020-03-08 大家好，我是python小白，今天记录一下我的爬虫学习之路，在爬取大众点评网站的时候遇到的问题。

国内某Python大神自创完整版，系统性学习Python

BCXQ2020的博客

05-19

2003

1.很多小伙伴纠结于这个一百天的时间，我觉得完全没有必要，也违背了我最初放这个大纲上来的初衷，我是觉得这个学习大纲还不错，自学按照这个来也能相对系统的学习知识，而不是零散细碎的知识最后无法整合，每个人的基础以及学习进度都不一样，没有必要纠结于一百天这个时间，甭管你是用三个月还是用一年来学习这些东西，最后学到了不就是收获吗？何必纠结于这一百天，觉得这一百天学习不完我就放弃了呢？（另，项目后面没有更新完，大家可以按照这个框架去学习，没有更新完的大家可以自行找资料。）给初学者的几个建议： Make Eng

从小白到Python大神只需要100天

MC_XY的博客

08-05

908

人工智能的火爆带火了编程语言Python，语法简单，语言易懂，一股Python学习热潮席卷职场，资深程序员jackfrued在Github上为毫无基础的新手做了一个100天成为Python大师的学习规划，很不错，参考一下。首先给初学者几个建议： Make English as your working language（把英语作为工作语言） Practice makes perfect（熟能生巧） All experience comes from mistakes（多犯错才能多积累经验） Don`

利用python爬取小说(转载)

03-18

1968

【小说网站 - 抓取登陆后的数据，cookie操作】

qq_29367075的博客

12-29

3720

今天搞一个小说网站，搞到一些只能登陆后才能获得的信息，比如这个网站，搞到某个用户下的所有书架信息。先登录上面是一个表单，一般都是post了一些数据到某个地址，于是我们可以通过调试手段抓取其登录信息。登录信息抓到了，表单信息也有，而且请求的url是：https://passport.17k.com/ck/user/login 接下来就是看看书架信息。每次点击书架，页面都会刷新，于是再来看看点击后的触发的ajax js操作。原来书架信息是json数据返回的，我们也能得到其请求的url是

Python实现番茄小说内容下载

python56123的博客

10-19

3334

嗨喽~大家好呀，这里是魔王呐 ❤ ~!

python爬虫——爬取快读小说app

小爬虫的博客

06-25

5308

1. 爬取结果（csv文件，出现了有两个表头…不明所以，无关大雅） 2. 使用fiddler4进行抓包通过观察url，我们不难发现其中的规律，要实现进行分类抓取，需要更改url第一个数字，如下 https://sc.canrike.com/Categories/1/hot/1.html https://sc.canrike.com/Categories/2/hot/1.html 要实现翻页...