单个页面爬虫

最新推荐文章于 2024-03-06 21:12:13 发布

小晨爱学习

最新推荐文章于 2024-03-06 21:12:13 发布

阅读量281

点赞数

文章标签：爬虫 html python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44798869/article/details/122419424

版权

from urllib import request
from bs4 import BeautifulSoup
import ssl

ssl._create_default_https_context=ssl._create_unverified_context

#一、网络请求页面
base_url = "http://www.shanbay.com/wordlist/110521/232414/?page=1"
response = request.urlopen(base_url)
html = response.read()

#二、bs4对象创建
soup = BeautifulSoup(html,'lxml')
tr_list=soup.select('.row')
for tr in tr_list:
    td_list=tr.select('td')
    # print(td_list)
    if td_list!=[]:
        word=td_list[0].contents[0].get_text()
        content=td_list[1].get_text()
        print(word,content)

结果如下：
在这里插入图片描述

小晨爱学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小晨爱学习 CSDN认证博客专家 CSDN认证企业博客

码龄6年

11: 原创

111万+: 周排名

84万+: 总排名

2万+: 访问

: 等级

115: 积分

41: 粉丝

3: 获赞

0: 评论

43: 收藏

私信

关注

热门文章

最新评论

爬虫抓取加入网页中
CSDN-Ada助手: 非常感谢CSDN博主的分享，学到了很多关于爬虫抓取加入网页的知识。我觉得下一篇可以继续探讨如何优化爬虫抓取效率，可以写一篇《Python爬虫优化技巧分享》，介绍如何利用多线程、异步IO等技术提高爬虫抓取效率，这样的技术文章对其他用户也会很有帮助。相信会有更多读者期待你的下一篇文章。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。