python爬取某网站小说

tudoubz

已于 2024-04-27 09:39:20 修改

阅读量479

点赞数 12

文章标签： python 爬虫

于 2024-04-19 13:38:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tudoubz/article/details/137958715

版权

目录

一.找到该网站的headers

二.找到某网站某一部小说的网址变化规律

三.代码爬取

一.找到该网站的headers

打开小说网页，点击F12打开开发者工具
点击网络，F5刷新下网页
选择网络下左侧名称，下拉至底部，得到User-Agent

二.找到某网站某一部小说的网址变化规律

小说第一章的网址

小说第二章的网址

则小说第n-1章的网址为：https://www.xxxx.xx/book/930/n.html

三.代码爬取文本

import requests
from bs4 import BeautifulSoup

此处为(一)中获得的headers

headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36 Edg/122.0.0.0'}

range中为想获得的章节数

####看300到350之间的小说
for i in range(300,350):
    url=f'https://www.xxxx.xx/book/930/{i}.html'#########输入小说的网址
    res=requests.get(url,headers=headers) 
    print(res.text)

去掉多余的格式

for i in range(300,350):
    url=f'https://www.biqg.cc/book/930/{i}.html'
    res=requests.get(url,headers=headers) 
    soup = BeautifulSoup(res.text,'html.parser') 
    novel_list = soup.find_all('body', class_='read')
    for novel in novel_list:
        title=novel.find('span',class_='title')
        content=novel.find('div',id='chaptercontent')
        print(content.title)
        print(content.text)

关注

12
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

tudoubz CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

135万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

326: 积分

115: 粉丝

139: 获赞

15: 评论

106: 收藏

私信

关注

热门文章

分类专栏

科研绘图 1篇

最新评论

python散点图颜色映射数值大小
CSDN-Ada助手: 恭喜您写下了第17篇博客！标题“python散点图颜色映射数值大小”很吸引人，内容想必也是很有深度的。希望您能继续保持创作的热情和动力，为大家带来更多有价值的内容。或许下一步可以尝试探讨其他数据可视化技巧，比如折线图或热力图等，相信会给读者带来新的启发和收获。期待您的下一篇作品！
python如何使用cartopy库来创建一个地图底图并绘制采样点位图
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
如何在高德开放平台获取密钥key
CSDN-Ada助手: 恭喜您发布了第14篇博客！学习如何在高德开放平台获取密钥key对于开发者们来说是非常有帮助的。希望您能继续分享更多关于开放平台的经验和技巧，或者可以深入探讨一些高级应用或案例分析，让更多人受益。谢谢您的分享！期待您更多精彩的创作！
python绘制简单折线图
CSDN-Ada助手: 恭喜您写了第15篇博客！不断学习和分享是很棒的事情。对于下一步的创作建议，我建议您可以尝试深入研究一些更高级的数据可视化技巧，比如使用Python绘制多元数据图表或者实现交互式数据可视化。希望您能继续保持热情，不断进步！祝您写作顺利！
Elasticsearch中word文本文件的存入与全文检索
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。