解决爬取多页问题

最新推荐文章于 2024-10-17 11:21:39 发布

樱花落尽云归兮

最新推荐文章于 2024-10-17 11:21:39 发布

阅读量116

点赞数 2

分类专栏： python爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_69435788/article/details/140059680

版权

python爬虫专栏收录该内容

7 篇文章 0 订阅

订阅专栏

import requests
from bs4 import BeautifulSoup

for page in range(1, 11): # 翻页操作
    URL = f'https://www.chinanews.com.cn/scroll-news/news{page}.html'
    Headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0'}
    response = requests.get(url=URL, headers=Headers)
    if response.status_code != 200:
        print(f"访问失败，错误码为{response.status_code}")
    else:
        response.encoding = 'utf-8'

    soup = BeautifulSoup(response.text, 'html.parser') # 解析文本
    li_list = soup.select('html > body > div.w1280.mt20 > div.content-left > div.content_list ul > li')
    for i in li_list:

        # 新闻类型
        if i.select_one('li > div > a') != None:
            NewsStyle = i.select_one('li > div > a').text
        # 新闻标题
            NewsTitle = i.select_one('li > div:nth-of-type(2) > a').text
        # 新闻链接
            NewsLJ = i.select_one('li > div:nth-of-type(2) > a').attrs['href']
            print(f"https://wwwe.chinanews.com.cn/{NewsLJ}")
        # 新闻时间
            NewsTime = i.select_one('li > div.dd_time').text
            print(f"类型：{NewsStyle}, 标题：{NewsTitle}, 链接：https://www.chinanews.com.cn/{NewsLJ}, 时间：{NewsTime}")

樱花落尽云归兮

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

樱花落尽云归兮 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

131万+: 周排名

132万+: 总排名

7797: 访问

: 等级

245: 积分

36: 粉丝

50: 获赞

7: 评论

58: 收藏

私信

关注

热门文章

分类专栏

python爬虫 7篇

最新评论

C语言数据结构 -- 栈的应用十进制转十六进制
2403_87987826: 不对吧
C语言数据结构 -- 栈的应用2 后缀表达式的计算
CSDN-Ada助手: 非常棒的博客！你的思路很清晰，让我对后缀表达式的计算有了更深刻的理解。同时，如果你想继续深入学习，可以了解一下中缀表达式转后缀表达式的算法，这也是栈在表达式计算中的一个重要应用。另外，可以尝试使用链表来实现栈，这样可以更好地管理内存，减少不必要的开销。期待看到你更多的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
C语言数据结构 -- 栈的应用3 中缀转后缀
CSDN-Ada助手: 非常感谢用户分享的这篇关于C语言数据结构中缀转后缀的文章，内容非常实用，读完之后对我理解栈的应用又更深刻了一些。恭喜用户能够持续创作，相信这样的努力一定会得到回报。建议下一步可以分享一些更高级的算法或者更深入的数据结构知识，期待更多优秀的作品。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
C语言数据结构 -- 串的基本操作
CSDN-Ada助手: 非常感谢用户分享了这篇关于C语言数据结构中串的基本操作的博客！相信这篇博客可以帮助到很多初学者更好地掌握串的基础知识。同时也非常欣赏用户的持续创作精神，希望用户可以继续保持，分享更多有价值的知识和经验。下一步的创作建议是，可以考虑结合实际应用场景，深入探讨串操作的高级应用，让读者更好地理解和运用串的相关知识。再次感谢用户的分享，期待更多精彩的博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
C语言数据结构 -- 串朴素模式匹配
CSDN-Ada助手: 非常感谢用户分享这篇关于C语言数据结构中串朴素模式匹配的博客。您的努力和创作热情让我们深受启发。不断学习和分享是不断进步的关键，期待您能够继续坚持创作下去。同时，建议您可以探讨更加深入的数据结构相关知识，为大家带来更多精彩的文章。再次感谢您的分享，期待您的下一篇作品。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。