BS库的基本元素与遍历方法

最新推荐文章于 2022-12-28 09:49:48 发布

是个小轮胎

最新推荐文章于 2022-12-28 09:49:48 发布

阅读量846

点赞数

分类专栏：爬虫基础文章标签： BeautifulSoup HTML解析标签遍历属性提取 Python库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qqmrchen124/article/details/116882139

版权

爬虫基础专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Beautiful soup 库 —第三方python库
导入并解析：即源代码的呈现

打印： print(soup.prettify() )
对美丽汤的理解：解析、遍历、维护“标签数”的功能库
BS 的解析库：bs4的HTML 解析库 等4个
格式：BeautifulSoup(mk,’ html.parser’)
BS 类基本元素：
在这里插入图片描述
代码实现：

说明：

先做汤
查看页面的title
获取a标签的链接标签（其实文本存在两个a标签）
通过Name查看名字
查看标签的属性，对属性的提取，获取a标签的链接属性，标签属性的类型以及标签怎么定义的

DEMO 的结构：

在这里插入图片描述
其基本格式：

涉及到遍历：下行，上行，
下行遍历：属性（contents children 遍历儿子节点 descendants遍历所有子孙节点）

上行遍历：（parent /patents）

标签树的上行遍历

平行遍历 是建立在同一个父亲节点下的！！
在这里插入图片描述

如如何让html页面更加友好的显示？

在这里插入图片描述
页面变成变量！
调用pretty -----
打印
这样就更清晰了

打印a 标签

是个小轮胎

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
BS库的基本元素与遍历方法

解析HTML页面信息标记与提取方法：Beautiful soup 库 —第三方python库导入并解析：即源代码的呈现打印： print(soup.prettify() )对美丽汤的理解：解析、遍历、维护“标签数”的功能库BS 的解析库：bs4的HTML 解析库等4个格式：BeautifulSoup(mk,’ html.parser’)BS 类基本元素：代码实现：说明：先做汤查看页面的title获取a标签的链接标签（其实文本存在两个a标签）通过Na
复制链接

扫一扫

专栏目录

是个小轮胎 CSDN认证博客专家 CSDN认证企业博客

码龄7年

83: 原创

7万+: 周排名

13万+: 总排名

4万+: 访问

: 等级

1260: 积分

345: 粉丝

431: 获赞

3: 评论

494: 收藏

私信

关注

热门文章

分类专栏

最新评论

互斥量介绍
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
芯片到底是怎么访问外设
Mr.Cssust: 一篇非常好的博客，讲得很清晰，让我对芯片和外设有了更深入的理解。感谢你的知识和经验分享！同时也希望可以来我博客指导我一番！
allegro两层PCB设计流程
延迟满足-: 好强
FPGA DMA基础知识
Fighting_FPGA: 请问CPU输出的指令一般包含什么信息呢？起始地址、空间大小吗，还需要发送读写请求吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。