标题**.find()和.find_all()和.select()和re.compile()在BeautifulSoup方法的使用**
.find_all()
是查询所有包含节点名称和属性的所有节点信息
find_all(name, attrs={}, recursive=True, text=None, limit=None, **kwargs)
name:查询节点的名称
attrs:查询节点的属性
recursive:是否进行递归查找
text:参数可用来匹配节点的文本,传入的形式可以是字符串,可以是正则表达式对象
limit:限制查询数量
.find()
是查询包含节点名称和属性的第一个节点信息,与.find_all()基本一致,但是没有limit限制参数
.select()
需要css选择器,与find_all类似
BeautifulSoup(html,‘lxml’).re.compile(“a”)
或者是
eautifulSoup(html,‘html.parser’).re.compile(“a”)
lxml没有html.parser全,但是比html.parser运行快,且lxml需要C语言库安装。
其中a可为所有的字符,以及特殊的字符。
可匹配查找BeautifulSoup()里面含有a的所有的节点的信息。