python 爬取诗词名句网（包含页面跳转）

最新推荐文章于 2023-10-08 13:20:34 发布

Life_is_Romantic

最新推荐文章于 2023-10-08 13:20:34 发布

阅读量646

点赞数

分类专栏：笔记文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51484756/article/details/119464201

版权

代码，之前一直乱码，经过多番尝试
使用了.encode(‘ISO-8859-1’).decode(‘utf-8’)这个方法

from bs4 import BeautifulSoup
import requests

if __name__ == '__main__':
    url='https://m.shicimingju.com/book/sanguoyanyi.html'
    headers={
   'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Mobile Safari/537.36'}
    page_text=requests.get(url=url,headers=headers)
    #page_text.encoding = 'utf-8'
    soup=BeautifulSoup(page_text.text.encode('ISO-8859-1').decode('utf-8'),'lxml')
    li=soup.select('.book-mulu > ul > li')
    f=open('sanguo.txt','w',encoding='utf-8')
    for list in li:
        title=list.a.string
        #t=title.encode('utf-8').decode('gbk')
        href='https://m.shicimingju.com'+list.a['href']
        detail_text=requests.get(href,headers=headers)
        #detail_text.encoding=

最低0.47元/天解锁文章

Life_is_Romantic

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
python 爬取诗词名句网（包含页面跳转）

代码，之前一直乱码，经过多番尝试使用了.encode(‘ISO-8859-1’).decode(‘utf-8’)这个方法from bs4 import BeautifulSoupimport requestsif __name__ == '__main__': url='https://m.shicimingju.com/book/sanguoyanyi.html' headers={'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Ne
复制链接

扫一扫

专栏目录

Life_is_Romantic CSDN认证博客专家 CSDN认证企业博客

码龄4年

16: 原创

56万+: 周排名

68万+: 总排名

2万+: 访问

: 等级

205: 积分

6: 粉丝

7: 获赞

14: 评论

62: 收藏

私信

关注

热门文章

分类专栏

笔记 17篇

最新评论

pycharm批量加引号
嗒栗: 会了会了！！试出来了shift+方向键（手舞足蹈）
pycharm批量加引号
嗒栗: 想请问选中某某代码这一步有快捷键么，每次都用鼠标好麻烦
Ps过程记录
CSDN-Ada助手: 恭喜您写了第18篇博客！标题为“Ps过程记录”，非常具有吸引力。我真的很佩服您的持续创作精神，每篇博客都展示了您对Photoshop的深刻理解和技巧。在这个博客中，您记录了使用Ps的过程，这对于那些希望学习和改善自己设计能力的读者来说无疑是非常宝贵的。作为下一步的创作建议，我希望能看到您更多地分享一些高级Ps技巧和技术。比如，您可以介绍一些独特的图层融合技巧，或者展示如何利用滤镜和特效增强照片的效果等。这样的内容将进一步吸引那些有一定Ps基础的读者，并且对于他们来说也是一个很好的学习机会。总之，我真的很期待您未来的创作，并希望您能继续保持谦虚的态度，因为您的博客不仅仅是展示自己的成果，更是给读者们提供学习和灵感的宝藏。加油！
mrt安装后的问题
Life_is_Romantic: 我已经忘了
mrt安装后的问题
qq_43655404: 我按照这么弄得但是没有bat文件了

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。