基于bs4库的HTML标签遍历方法
import requests
r=requests.get('http://python123.io/ws/demo.html')
demo=r.text
HTML基本格式
HTML可以看做一棵标签树
遍历方法
!
下行遍历
属性
说明
.contents
将该标签所有的儿子节点存入列表
.children
子节点的迭代类型,和contents类似,用于遍历儿子节点
.descendants
子孙节点的迭代类型,包含所有的子孙跌点,用于循环遍历
import requests
from bs4 import Beautiful