一、导入包命令
from bs4 import BeautifulSoup
二、使用于requests库的结果
res = BeautifulSoup(req.text, “lxml”)
三、重要方法
find: 返回第一个找到的结果,没有返回None
find_all: 返回一个列表,没有就返回空列表
四、根据id获取某个标签下所有内容
```
res = BeautifulSoup(req.text, "lxml")
# print(res)
box = res.find(id="column2")
```
五、根据class获取某个标签下所有内容
res = BeautifulSoup(req.text, "lxml")
# print(res)
box = res.find(_class="column")
注意这里class前面必须加符号"_"
六、使用name获取某个标签下所有内容
ul = box.find_all(name="ul")
for i in ul:
li = i.find_all("li")
一般情况下如果不是id也不是class,就可以使用“name”属性,比如常见的ul、li
注意循环获取下一级
获取某个标签属性值
my_href = j.find(name="a")["href"]
获取a标签的href属性值
获取某个标签文本
j.find(name="a").get_text():
获取a标签下的文本
以上用法可以完成BeatifulSoup 90%以上的工作