- 查找标签
soup.find('a') # 查找第一个a 标签
soup.find_all('a') # 查找所有的a 标签
soup.select('.item') # 查找所有class 为 item的标签
soup.select('div > p') # 查找所有div标签下的p标签
2 获取属性值
link=soup.find_all('a')
link['href'] # 获取href的属性值
# 使用get 方法获取属性值,如果属性值不存在,则返回 None
link.get('href')
link.text # 获取标签的文本内容
link.attrs # 获取标签的所有属性值,以字典的形式返回
link.contents # 获取标签的所有子节点
link.descendants # 获取div标签的所有后代节点