BeautifulSoup
bs4主要使用find()方法和find_all()方法来搜索文档。
find()用来搜索单一数据,find_all()用来搜索多个数据
find_all()与find()
name –> tag名
string –> 内容
recursive –>是否搜索所有子孙节点 默认为true 设为false只搜索子节点
两方法用法相似这里以find_all()为例。
#搜索tag名 <title></title>
soup.find_all("title")
#关于属性
#搜索id为"link2"的标签
soup.find_all(id='link2')
#这里属性的值可以使用字符串,正则表达式 ,列表,True
soup.find_all(id=re.compile("elsie"))
#可以指定多个条件
soup.find_all(href=re.compile("elsie"), id='link1')
#对于有些不能指定的标签(data-foo)
soup.find_all(attrs={
"data-foo": "value"})
#对于class -->class为python保留字使用class_
soup.find_all(class_="top")
#属性结束