爬取飞卢小说免费的小说内容

最新推荐文章于 2024-11-11 15:07:26 发布

努力学习各种软件

最新推荐文章于 2024-11-11 15:07:26 发布

阅读量784

点赞数 5

分类专栏：爬虫案例文章标签：爬虫

本文链接：https://blog.csdn.net/m0_57265868/article/details/136259236

版权

爬虫案例专栏收录该内容

26 篇文章

订阅专栏

import requests

import parsel
import re
import os

url = 'https://b.faloo.com/724903.html'
headers = {
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
}
response_1 = requests.get(url=url,headers=headers)
response_1.encoding = response_1.apparent_encoding
select_1 = parsel.Selector(response_1.text)
href_list = select_1.css('.DivTd3 a::attr(href)').getall()
Title = select_1.css('#novelName::text').get()
print(Title)
print(href_list)
filename = f'{Title}\\'
if not os.path.exists(filename):
    os.mkdir(filename)
for href in href_list:
    href = 'https:'+href
    headers = {
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
    }
    response = requests.get(url=href,headers=headers)
    response.encoding = response.apparent_encoding
    # print(response.text)
    selector = parsel.Selector(response.text)
    title = re.findall('<h1>玄幻：我！天命大反派   (.*?)</h1>',response.text)[0]
    content = '\n'.join(selector.css('.noveContent p ::text').getall())
    with open(filename+title+'.txt',mode='w',encoding='utf-8') as f:
        f.write(content)

结果展现：

总结：

1.几个快捷进入开发者工具的指令：

打开开发者工具方法：F12(键盘)/fn+f12/ctrl+shift+i

2.列表转字符串方法：

str.join(列表)

如'\n'.join(selector.css('.noveContent p ::text').getall())

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努力学习各种软件

关注关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

python实战项目23：爬取飞卢小说网免费小说

lyccomcn的博客

06-21

1359

首先看一下我们需要爬取的飞卢小说网的免费小说《全民：开局邀请光头强挑战只狼》网址，如下图所示：点击第一章，按F12键打开浏览器开发者工具，再点击开发者工具左上角的小箭头，找到小说内容在网页中所在的位置，如下图所示：# 提取小说文字部分内容content = re.sub('【恭喜宿主.*', '', content).strip()接下来，回到目录页，找到章节url和标题所在的位置，如下图所示：# 获取目录页网页源代码# 提取所有章节的链接和标题links = []

第5期-通过飞卢小说网爬取小说

我是瞎老弟

09-07

6323

飞卢小说，说实话还是第一次听说，可能是因为我孤陋寡闻的缘故，别在意。我才不会告诉你，因为我平时只看笔趣阁呢。首先随便选择一本热门小说吧 https://b.faloo.com/476534.html 这个地址没有任何反爬，可以轻松获取到所有小说列表，当然里面可能有一些奇怪的符号，替换掉就没问题了进入小说的详情页以后，直接请求地址 https://b.faloo.com/476534_2.html 可以看到同样也是没有任何反爬措施，直接就可以获取数据了如今云纳兰虽年仅十三岁，但斗气.

参与评论您还未登录，请先登录后发表或查看评论

使用Python爬虫技术爬取飞卢小说内容

2301_78150559的博客

11-11

1885

我们本次的目标是爬取飞卢小说网站（网址：https://b.faloo.com/）上某本小说的章节内容。具体来说，我们会聚焦于一部名为《偷吃我外卖被辣哭，问我要索赔？》的小说。通过分析其网页结构，我们将实现对小说标题和内容的自动获取，便于后续的阅读或者数据分析。

飞卢小说网爬虫源代码附件

09-28

飞卢小说网pyhon3爬虫爬取练习附件源码，练习写的不是很完善，欢迎交流

使用selenium爬取飞卢小说网排行榜的小说标题

andux的专栏

10-24

432

使用selenium集成化爬虫工具，它的xpath跟scrapy等有一定区别，scrapy等需要使用get()或者extract()等函数来获取dom节点，而selenium就不需要了。飞卢小说网的排行榜中，每个小说块的class都是一样的，这样获取整页的div块的xpath就很好写了。把爬取代码放到try里面，是为了出错时程序不会中断，继续执行下去。一个点（.）是指当前子目录中，没有点的话，就是直接从根目录开始了。

python爬上去飞卢_pyhon3爬虫爬取飞卢小说网小说

weixin_39957186的博客

12-15

2973

想看小说，不想看花里胡哨的网页，想着爬下来存个txt，顺便练习一下爬虫。随便先找了个看起来格式比较好的小说网站《飞卢小说网》做练习样本，顺便记录一下练习成果。ps:未登录，不能爬取VIP章节部分目录使用工具网页结构分析爬虫实现结果展示使用工具python3 ,beaufulsoup库，request库网页结构分析随便在网站找了个小说，分析网页结构：https://b.faloo.com/f/47...

pyhon3爬虫爬取飞卢小说网小说

热门推荐

weixin_42752144的博客

09-28

1万+

想看小说，不想看花里胡哨的网页，想着爬下来存个txt，顺便练习一下爬虫。随便先找了个看起来格式比较好的小说网站《飞卢小说网》做练习样本，顺便记录一下练习成果。 ps:未登录，不能爬取VIP章节部分目录使用工具网页结构分析爬虫实现结果展示使用工具 python3 ,beaufulsoup库，request库网页结构分析随便在网站找了个...

Python爬虫案例—飞卢小说爬取

rallan963的博客

06-24

2486

#小说未加密的爬取： #1：提取小说的名字、章节的顺序、章节的名字、章节的内容 #2：下载小说，用合适的规则保存文章 #该页面在下载好库后，在d盘下建立一个小说文件即可全部复制粘贴运用

记录一次爬取小说的经历

weixin_33895604的博客

10-11

133

2019独角兽企业重金招聘Python工程师标准>>> ...

自学爬虫第二天，飞卢小说网。

Myc970223的博客

08-16

1876

2.对左侧的html文档右键点击复制构建请求头，然后看一下响应给我们的信息有没有乱码或者显示问题。当两个编码一样的时候，encoding还是原来的，如果不一样，那么就把apparent_encoding的编码赋给response.encoding。依赖的库：requests, lxml, parsel（因为要熟悉第三方库，所以在爬title和具体的内容时用了不同的库去解析）到此，这篇小说的可爬部分已经全部被爬取下来，有兴趣的可以自行尝试。执行，发现45章都成功爬取，且36章的喽啰的啰也成功解析。

爬取飞卢小说网的小说

weixin_54027333的博客

08-31

1万+

爬取飞卢小说网的任意小说

爬虫实战--- （7）采集飞卢小说内容

qq_51749909的博客

10-21

1981

本次的目标是爬取飞卢小说网站（网址：https://b.faloo.com/）上某本小说的章节内容。具体来说，我们会聚焦于一部名为《偷吃我外卖被辣哭，问我要索赔？》的小说。通过分析其网页结构，我们将实现对小说标题和内容的自动获取，便于后续的阅读或者数据分析。

【网络爬虫】(3) 案例小结，文本内容爬取，附Python代码

博观而约取，厚积而薄发

03-25

2241

本节总结一下各种文本内容爬取的方法，进行一下案例实战，附详细解析，包含：微博评论爬取；结果展示，文件名是问题，内容是回答，以txt保存。结果展示，评论信息保存在excel中。2. 豆瓣TOP250电影信息爬取。结果展示，电影信息以CSV文件保存。结果展示，小说文本以txt格式保存。

爬取飞卢小说，并计算文本中词语出现的次数

m0_57265868的博客

03-03

299

【代码】爬取飞卢小说，并计算文本中词语出现的次数。

【零基础学爬虫】学Python的第一周，自己编写用Python爬取vip小说付费章节，实现小说自由！

python03011的博客

06-05

8807

【零基础学爬虫】学Python的第一周，自己编写用Python爬取vip小说付费章节，实现小说自由！

pyhon3爬虫爬取小说(仅供学习使用。爬虫项目小实践)

IT赵云的博客

07-11

6291

此代码实现了通过输入作者名查找小说，列出相似作者的小说，通过用户自行选择小说名下载，亦实现了通过输入小说名字查找小说。相关代码已上传至github:https://github.com/qazhw/paFeiLuXS 使用工具 python3 ,BeautifulSoup库，requests库网页分析随便在飞卢上找一本小说 https://b.faloo.com/965864.html以此为例我们发现所有章节都存放在class="DivTd"的div便签中，这里我直接提....

【每周一爬】爬取盗版小说网的小说

逐梦

04-03

4185

【本帖持续更新，直到能将一本书全部爬到一个.txt文件中】一：准备工作爬取的网站地址：http://b.faloo.com/tag/6293.html 爬取的书：与校花同居的大盗链接：https://b.faloo.com/f/163306.html找到存放文本的html标签先打开小说的第一章，我们可以采用审查元素的方式来找到这个网页的源代码。一般...

Python利用创建1000个线程爬取盗版小说网站，并按章节顺序排列在txt文件里

xccxvb1的博客

06-28

4082

Python利用创建1000个线程爬取盗版小说网站，并按章节顺序排列在txt文件里文中和源码里的具体网址我都去掉了，本贴不提供成品，仅作学习交流！！！前言：上次我写了一篇教程：32个进程爬取小说并存在不同的txt里，有的人说文章在不同txt里不方便，自己也不会合并，那好，今天我们1000个线程（注意上次是进程这次是线程，老是有人搞混）爬取某个小说，并按照章节顺序存在txt里，这个txt我们用主流阅读软件打开都是会自动显示目录的，如下图！上次多进程爬的那个网站已经采取了反爬措施，不行了。所以

用python爬取小说章节内容

寻的博客

02-05

3028

在学爬虫之前, 最好有一些html基础, 才能更好的分析网页. 主要是五步: 1. 获取链接 2. 正则匹配 3. 获取内容 4. 处理内容 5. 写入文件代码如下: #导入相关model from bs4 import BeautifulSoup import requests import re #获取目标链接地址 url = 'http://www.biquyun....

python爬取飞卢小说网