python-package(beautifulsoup)-2

最新推荐文章于 2024-09-23 19:49:13 发布

十四呀

最新推荐文章于 2024-09-23 19:49:13 发布

阅读量283

点赞数

分类专栏： python 文章标签： html python beautifuls

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011445855/article/details/79057031

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Navigating trees
导航树

from urllib.request import urlopen
from urllib.error import HTTPError ,URLError
from bs4 import BeautifulSoup

#打开url
html = urlopen("http://www.pythonscraping.com/pages/page3.html")
#创建beautifulsoup对象
bsObj = BeautifulSoup(html.read())

#子标签是指父标签的下一级，后代标签是指下面的所有级别的标签
#比如tr是table的子标签，tr，th,td，img，span都是table的后代标签（示例html中）

#第一个div标签的所有img标签
#print (bsObj.div.findAll("img"))
#打印子标签
print ("------------")
for child in bsObj.find("table",{"id":"giftList"}).children:
    print (child)
print ("+++++++++++++++++++++")
#打印后代标签
for child in bsObj.find("table",{"id":"giftList"}).descendants:
    print (child)

#处理兄弟标签
#兄弟标签不包括自己本身，这个函数只会调用他后面的兄弟标签
for sibling in bsObj.find("table",{"id":"giftList"}).tr.next_siblings:
    print (sibling)

#打印父标签
print (bsObj.find("img",{"src":"../img/gifts/img1.jpg"}).parent.previous_sibling.get_text())

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

十四呀 CSDN认证博客专家 CSDN认证企业博客

码龄11年

23: 原创

33万+: 周排名

173万+: 总排名

4万+: 访问

: 等级

638: 积分

8: 粉丝

4: 获赞

2: 评论

52: 收藏

私信

关注

热门文章

分类专栏

robotframe 2篇
shell 2篇
python 8篇
oracle 11篇
tuxedo 3篇
java 1篇
c 1篇
linux
R 4篇

最新评论

Tuxedo
z55716368: 想请教一下楼主，在tpcall的时候通信断开（网线拔掉），这个时候会出现卡住现象，在不确定时间恢复或者一直卡死；这样的异常要怎么解决呢？另外tpbegin给了时间，这个时间如果事务没有完成，程序从哪里继续往下走？可以从哪里判断事务超时然后做其他事情？
tuxedo-使用小结（写的很好，转了）
z55716368: 楼主你好，请问客户端在执行tpinit的时候网络断开导致程序卡死的情况应该怎么设置超时

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。