BS库的基本元素与遍历方法

Beautiful soup 库 —第三方python库
导入并解析: 即源代码的呈现

打印: print(soup.prettify() )
对美丽汤的理解: 解析、遍历、维护“标签数”的功能库
BS 的解析库:bs4的HTML 解析库 等4个
格式:BeautifulSoup(mk,’ html.parser’)
BS 类基本元素:
在这里插入图片描述
代码实现:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
说明:

  1. 先做汤
  2. 查看页面的title
  3. 获取a标签的链接标签(其实文本存在两个a标签)
  4. 通过Name查看名字
  5. 查看标签的属性,对属性的提取,获取a标签的链接属性,标签属性的类型以及标签怎么定义的

DEMO 的结构:

在这里插入图片描述
其基本格式:
在这里插入图片描述
涉及到遍历:下行,上行,
下行遍历: 属性(contents children 遍历儿子节点 descendants遍历所有子孙节点)
在这里插入图片描述
在这里插入图片描述
上行遍历:(parent /patents)
在这里插入图片描述
标签树的上行遍历
在这里插入图片描述
平行遍历 是建立在同一个父亲节点下的!!
在这里插入图片描述
在这里插入图片描述

如如何让html页面 更加友好的显示?

在这里插入图片描述
页面变成变量!
调用pretty -----
打印
这样就更清晰了
在这里插入图片描述

打印a 标签在这里插入图片描述
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值