python取第一个子标签_python库学习笔记——BeautifulSoup处理子标签、后代标签、兄弟标签和父标签...

最新推荐文章于 2023-07-12 10:52:37 发布

weixin_39852647

最新推荐文章于 2023-07-12 10:52:37 发布

阅读量1.2k

点赞数

文章标签： python取第一个子标签

首先，我们来看一个简单的网页https://www.pythonscraping.com/pages/page3.html，打开后：

右键“检查”(谷歌浏览器)查看元素：

用导航树的形式简单表示出来：

可知：

tr是table的子标签

tr、th、td、img、span标签都是table的后代标签

一般情况下，bbs0bj.body.h1选择的是body标签后代里的第一个h1标签，不会去找body外面的标签

类似的，bs0bj.div.findall("img")会找到第一个div标签，然后获取这个div后代里面所有的img标签

1. 处理子标签和后代标签

如果你想获得子标签，可以用.children标签：

from urllib.request import urlopen

from bs4 import BeautifulSoup

html = urlopen("http://www.pythonscraping.com/pages/page3.html")

bsObj = BeautifulSoup(html)

for child in bsObj.find("table",{"id":"giftList"}).children:

print(child)

部分结果如下ÿ

最低0.47元/天解锁文章

weixin_39852647

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python取第一个子标签_python库学习笔记——BeautifulSoup处理子标签、后代标签、兄弟标签和父标签...

首先，我们来看一个简单的网页https://www.pythonscraping.com/pages/page3.html，打开后：右键“检查”(谷歌浏览器)查看元素：用导航树的形式简单表示出来：可知：tr是table的子标签tr、th、td、img、span标签都是table的后代标签一般情况下，bbs0bj.body.h1选择的是body标签后代里的第一个h1标签，不会去找body外面的标签类...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。