python bs4 BeautiSoup入门
结果:
prettify():
直接打印相关内容
有多个相同标签时
找到三个href
bs4 对象种类
bs4 tag标签
找标签属性——attrs
NavigableString可导航的字符串
soup对象
comment 注释
遍历文档树
contents chlidren descendents
string strings stripped strings–把多余空格去掉
string——获取标签里面的内容
strings——返回是一个生成器对象用过来获取多个标签内容
stripped_strings——和strings基本一致 但是它可以把多余的空格去掉
遍历父节点
parent
html的父节点是整个soup对象
parents
遍历兄弟节点
next_sibling 下一个兄弟节点
previous_sibling 上一个兄弟节点
搜索数——findAll&find_all
find()找一个
find_all()找全部以列表形式返回
find_all只找某几条
1.class_
attrs{:}
多重约束条件
获取标签内部信息