爬取小说时的一些小细节，大家可以先试试，然后在用我的另一篇文章

电科小王

已于 2022-10-25 13:20:43 修改

阅读量72

点赞数

文章标签： python 开发语言

于 2022-08-08 17:02:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62640108/article/details/126231347

版权

import requests
from bs4 import BeautifulSoup
target ='xxxxxxxxx'#第五章内容
response = requests.get(target)#其中之所以要加headers这一段是因为有些网页会识别到你是通过python请求的然后把你拒绝，所以我们要换个正常的请求头。可以随便找一个或者f12从网络信息里复制一个。
response.encoding = 'utf-8'
html = response.text
bf = BeautifulSoup(html,"lxml")
texts = bf.find("div",id = "content")#一般小说都是这个开头
print(texts)
print(texts.text)#这只是一章的内容，但是可以提取所有章节的部分网址，然后一个一个爬取
f=open("xxxxxx.txt","a",encoding='utf-8')#内容是汉字时会出现乱码，这是时要用encoding='utf-8'
f.write(texts.text)
target1 ='xxxxxxxxx'#所有章节
response1 = requests.get(target1)
response1.encoding = 'utf-8'
html1 = response1.text
bf1=BeautifulSoup(html1,"lxml")
texts1 = bf1.find("div",id = "list")#章节一般是list
texts2 = texts1.find_all("a")
names=[]
urls=[]
for i in texts2:
    print(i.string)
    print(i.get("href"))
    names.append(i.string)
    urls.append(i.get("href"))
    print(len(names))#现在得到了所有章节部分的网址，i.string提取标签中的文字，i.get(“href”)提取a标签中的href属性值，由此我们就获得了所有章节的链接地址了

相关的函数，我会在其他文章中写到。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

电科小王 CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

122万+: 周排名

188万+: 总排名

4940: 访问

: 等级

169: 积分

2: 粉丝

1: 获赞

10: 评论

8: 收藏

私信

关注

热门文章

最新评论

python 将数字变成数组以及将数组变成数字
CSDN-Ada助手: 恭喜您写了第13篇博客！标题看起来非常有趣，我很期待阅读您关于将数字变成数组以及将数组变成数字的内容。您的博客一直给我带来很多启发，我真的很感谢您的分享。如果我可以提一个创作建议的话，我想建议您在下一篇博客中可以深入探讨如何处理特殊情况，比如当输入包含非数字字符或者超出数组范围时应该怎么处理。这样的内容会进一步帮助读者理解和应用您提供的方法。再次感谢您的辛勤努力，我期待着您未来更多精彩的博客！
python map函数分析(高级迭代器)
CSDN-Ada助手: 恭喜您写了这么精彩的一篇关于python map函数的分析，对高级迭代器的理解令人钦佩。希望您能继续保持创作的热情和劲头，不断分享您对技术的见解和经验。或许下一步可以考虑写一些实际案例或者是对python其他高级函数的分析，让更多的读者受益。期待您更多的精彩内容！
python中的int（）函数和一些转进制的函数
CSDN-Ada助手: 恭喜您写了第15篇博客！看了您的博客，对Python中的int()函数和进制转换有了更深入的了解。接下来，我建议您可以尝试结合实际案例或者应用场景，深入探讨这些函数的灵活运用以及可能遇到的一些问题和解决方法，这样可以让读者更加直观地理解和学习。希望您继续保持创作，期待您更多精彩的分享！
最最最最基础的动态规划！（力扣64：最小路径）
CSDN-Ada助手: 恭喜您写完了第16篇博客！标题中的"最最最最基础的动态规划"确实引人注目。您对力扣64题的最小路径问题进行了深入的分析，让读者更好地理解了动态规划的基本原理。不过，既然您已经掌握了基础，接下来或许可以尝试一些更复杂或者更具挑战性的动态规划问题，以进一步提升自己的能力。期待您的下一篇博客！谦虚地说，我相信您能够写出更加精彩和有启发性的内容。加油！
异步的很简单的代码
电科小王: 记得装相应的Python库哦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。