find()
若希望会找到BeautifulSoup对象内的 任何第一个标签入口,使用find方法,返回标签内容。
find(name,attrs, recursive, text, **wargs)#recuasive 递归,循环的; 默认true
- 通过对name限定,查找标签
- 对text限定,查找文本
- 基于正则表达式的查找
- 对attrs限定,查找标签的属性例如:attrs = {‘class’: ‘item’}
- 对于函数查找
- 可以将以上方法进行组合查找
find_all()
find_all()查找所有匹配结果出现的地方。
data = soup.body.find_all(‘div’, {‘class’: ‘movie-item-info’})注意:data是列表类型。
find_all(name, attrs, recursive, text, limit, **kwargs)参数与find参数相同,参数limit限制结果数量。
类似find_parents(),find_all_parents()等函数,他们类似find(),find_all()的区别
soup = BeautifulSoup(html,“html.parser”)
soup.标签名称 获取该标签的信息内容(只输出第一个)