python爬上去飞卢_pyhon3爬虫爬取飞卢小说网小说

最新推荐文章于 2024-11-11 15:07:26 发布

weixin_39957186

最新推荐文章于 2024-11-11 15:07:26 发布

阅读量2.9k

点赞数 2

文章标签： python爬上去飞卢

本文链接：https://blog.csdn.net/weixin_39957186/article/details/111435220

版权

想看小说，不想看花里胡哨的网页，想着爬下来存个txt，顺便练习一下爬虫。

随便先找了个看起来格式比较好的小说网站《飞卢小说网》做练习样本，顺便记录一下练习成果。

ps:未登录，不能爬取VIP章节部分

使用工具

网页结构分析

爬虫实现

结果展示

使用工具

python3 ,beaufulsoup库，request库

网页结构分析

随便在网站找了个小说，分析网页结构：

https://b.faloo.com/f/479986.html 以此页为例，可以发现，目录页全部整齐的在后面加上了章数https://b.faloo.com/p/479986/4.html

这里不用更换网址的方法，选用找到存放目录的a标签，逐一获取链接的方式练习。

首先，分析目录页结构，对元素右键进行检查

可以发现，目录链接全部存放在table里，很整齐的在类名为td_0的td中；

接着分析每节内容，发现小说内容全部储存在 id=content 的div中：

爬虫实现

首先需要获取这本小说所有的章节链接，从网页结构可以发现，链接全部存储再table的td中。

用get_download_url方法循环获取table中tr的内容，再使用BeautifulSoup的find方法挨个提取td中的a

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39957186

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python实战项目23：爬取飞卢小说网免费小说

lyccomcn的博客

06-21

1398

首先看一下我们需要爬取的飞卢小说网的免费小说《全民：开局邀请光头强挑战只狼》网址，如下图所示：点击第一章，按F12键打开浏览器开发者工具，再点击开发者工具左上角的小箭头，找到小说内容在网页中所在的位置，如下图所示：# 提取小说文字部分内容content = re.sub('【恭喜宿主.*', '', content).strip()接下来，回到目录页，找到章节url和标题所在的位置，如下图所示：# 获取目录页网页源代码# 提取所有章节的链接和标题links = []

飞卢小说网爬虫源代码附件

09-28

飞卢小说网pyhon3爬虫爬取练习附件源码，练习写的不是很完善，欢迎交流

参与评论您还未登录，请先登录后发表或查看评论

Python爬虫案例—飞卢小说爬取

rallan963的博客

06-24

2518

#小说未加密的爬取： #1：提取小说的名字、章节的顺序、章节的名字、章节的内容 #2：下载小说，用合适的规则保存文章 #该页面在下载好库后，在d盘下建立一个小说文件即可全部复制粘贴运用

pyhon3爬虫爬取飞卢小说网小说

最新发布

2301_78150559的博客

11-11

2023

我们本次的目标是爬取飞卢小说网站（网址：https://b.faloo.com/）上某本小说的章节内容。具体来说，我们会聚焦于一部名为《偷吃我外卖被辣哭，问我要索赔？》的小说。通过分析其网页结构，我们将实现对小说标题和内容的自动获取，便于后续的阅读或者数据分析。

python爬虫-基于python 实现的爬取人民日报，爬取人民日报文章后存储到本地课程设计（课程设计报告+源码）

06-27

【作品名称】：python爬虫-基于python 实现的爬取人民日报，爬取人民日报文章后存储到本地【课程设计】（课程设计报告+源码）【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程...

python爬虫爬取巨潮资讯网的pdf文件

qq_43482644的博客

06-07

5187

爬虫爬取巨潮资讯网不同公司的公告文件，并保存在本地文件中。python

爬虫实战--- （7）采集飞卢小说内容

qq_51749909的博客

10-21

2083

本次的目标是爬取飞卢小说网站（网址：https://b.faloo.com/）上某本小说的章节内容。具体来说，我们会聚焦于一部名为《偷吃我外卖被辣哭，问我要索赔？》的小说。通过分析其网页结构，我们将实现对小说标题和内容的自动获取，便于后续的阅读或者数据分析。

第5期-通过飞卢小说网爬取小说

我是瞎老弟

09-07

6344

飞卢小说，说实话还是第一次听说，可能是因为我孤陋寡闻的缘故，别在意。我才不会告诉你，因为我平时只看笔趣阁呢。首先随便选择一本热门小说吧 https://b.faloo.com/476534.html 这个地址没有任何反爬，可以轻松获取到所有小说列表，当然里面可能有一些奇怪的符号，替换掉就没问题了进入小说的详情页以后，直接请求地址 https://b.faloo.com/476534_2.html 可以看到同样也是没有任何反爬措施，直接就可以获取数据了如今云纳兰虽年仅十三岁，但斗气.

爬虫源代码

08-08

爬虫软件 (golang)] Pholcus（幽灵蛛）是一款纯Go语言编写的高并发、分布式、重量级爬虫软件，支持单机、服务端、客户端三种运行模式，拥有Web、GUI、命令行三种操作界面；规则简单灵活、批量任务并发、输出方式丰富（mysql/mongodb/csv/excel等）、有大量Demo共享；同时她还支持横纵向两种抓取模式，支持模拟登录和任务暂停、取消等一系列高级功能

python爬上去飞卢_学霸的黑科技系统

weixin_39920629的博客

12-15

436

第四十六章夜刷Python上一章←章节目录→下一章加入书签热门推荐：圣墟龙王传说三寸人间天下第九飞剑问道我是至尊凡人修仙之仙界篇元尊大道朝天大龟甲师晚饭过后，杨女士开车将陆舟和陈玉珊送回了学校。临走之前，韩梦琪依依不舍地说了声再见。从明天开始，她的暑假就要开始了。按照杨女士的说法，她暑假会到沪上去过，在她爸爸那边一直待到月底。在这段时间里，补课自然是没法进行了。下一次补课，得等到九月份再继续了。走...

pythoon网页爬取小说源代码（~~~明月小说网~~~）

m0_71113971的博客

07-19

1174

最近一直在找横练加点升级流小说发现有一本《武侠开局横练童子功》的小说看起来还不错，但是找遍全网大部分都是飞卢的，所以你懂的0.0，后便找了能看书的网站自己爬~~~。备注若是想怕网站别的小说要把"div[class='back_r190727']"标签地址换一下就ok了。fromurllib.requestimporturlopen#用于获取网页。frombs4importBeautifulSoup#用于解析网页。#1、创建请求对象，包装ua信息。#2、发送请求，获取响应对象。...

python爬上去飞卢_都市之科技之门

weixin_39713578的博客

12-15

683

【零基础学爬虫】学Python的第一周，自己编写用Python爬取vip小说付费章节，实现小说自由！

python03011的博客

06-05

8881

【零基础学爬虫】学Python的第一周，自己编写用Python爬取vip小说付费章节，实现小说自由！

自学爬虫第二天，飞卢小说网。

Myc970223的博客

08-16

1905

2.对左侧的html文档右键点击复制构建请求头，然后看一下响应给我们的信息有没有乱码或者显示问题。当两个编码一样的时候，encoding还是原来的，如果不一样，那么就把apparent_encoding的编码赋给response.encoding。依赖的库：requests, lxml, parsel（因为要熟悉第三方库，所以在爬title和具体的内容时用了不同的库去解析）到此，这篇小说的可爬部分已经全部被爬取下来，有兴趣的可以自行尝试。执行，发现45章都成功爬取，且36章的喽啰的啰也成功解析。

飞卢小说下载

我不是码农的博客~~~

11-15

426

【代码】飞卢小说下载。

使用selenium爬取飞卢小说网排行榜的小说标题

andux的专栏

10-24

440

使用selenium集成化爬虫工具，它的xpath跟scrapy等有一定区别，scrapy等需要使用get()或者extract()等函数来获取dom节点，而selenium就不需要了。飞卢小说网的排行榜中，每个小说块的class都是一样的，这样获取整页的div块的xpath就很好写了。把爬取代码放到try里面，是为了出错时程序不会中断，继续执行下去。一个点（.）是指当前子目录中，没有点的话，就是直接从根目录开始了。

python爬上去飞卢_我的文起点没签，飞卢签了，为什么？

weixin_39787089的博客

12-15

680

我不是写书的，只是一个普通飞卢读者，看到就点进来了特意去看了一下飞卢的签约价格，确实有点广撒网的意思在里面了说实话我没见过这么低的全勤，不知道你签的是什么但不得不说飞卢给新人的机会还是很多的，基本上只要你发，点击就不会低到哪去，而且只要有人看了就自动给你入收藏了，像我这种是没有清理收藏和书架的习惯的，在那就在那吧我现在在飞卢看书都不会去看点击和收藏量，更看重的是打赏和鲜花，看了大大的数据，确实不是...