Python网络爬虫入门版笔记六、基于bs4库的HTML遍历方法

最新推荐文章于 2022-09-03 14:44:51 发布

RecycleBins

最新推荐文章于 2022-09-03 14:44:51 发布

阅读量444

点赞数 2

分类专栏： Python网络爬虫——入门篇文章标签： python

本文链接：https://blog.csdn.net/tomatoarmys/article/details/105468001

版权

本文介绍了Python网络爬虫中HTML遍历的基本方法，包括下行遍历、上行遍历和平行遍历。下行遍历涉及节点及其子孙节点的遍历，上行遍历则关注标签的父节点，而平行遍历着重于同一父节点下的标签兄弟节点。内容通过实例代码进行了详细解释。

摘要由CSDN通过智能技术生成

一、结构介绍

当我们打开一个html文档时可以发现这是一个具有树形结构的文本。

以前面的演示界面来看，其树形结构为：

现在介绍三种遍历方式：下行遍历、上行遍历、平行遍历。

属性	说明
.contents	子节点的列表，将<tag>所有儿子节点存入列表
.children	子节点的迭代类型，与contents类似，用于循环遍历儿子节点
.descenda

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注