1.概念要清晰
BeautifulSoup库是用来解析HTML和XML文档的一些功能库
2.使用方法
from bs4 import BeautifulSoup #来引入BeautifulSoup的类型,并用这个类型加载相关的解析器,来解析一个变量出来
soup = BeautifulSoup('<p>data</p>','.html.parser') #soup这个变量就是用来去提取信息和遍历信息的BeautifulSoup的类型
3.bs4库的5种基本元素
Tag Name Attributes NavigableString Comment
4.bs4库的三种遍历
下行遍历 上行遍历 平行遍历
.contents .parent .next_sibling
.children .parents .previous_sibling
.descendants .next_siblings
.previous_siblings