BeautifuiSoup库的基本元素
BeautifuiSoup库的引用
from bs4 import BeaufifulSoup
BeautifuiSoup库解析器
解析器:bs4的HTML解析器 使用方法:BeautifulSoup(mk,'html.parser') BeautifulSoup 条件:安装bs库
解析器:lxml的HTML解析器 使用方法::BeautifulSoup(mk,'lxml')BeautifulSoup 条件:pip install lxml
解析器:lxml的XML解析器 使用方法::BeautifulSoup(mk,'lxml') BeautifulSoup 条件:pip install lxml
解析器:html5lib的解析器 使用方法::BeautifulSoup(mk,'html5lib')BeautifulSoup 条件:pip install html5lib
BeautifulSoup类的基本元素
基本元素 | 说明 |
Tag | 标签 ,最基本的信息组织单元,分明用<>和标明开头和结尾 |
Name | 标签的名字, ... 的名字是'p',格式:.name |
Attrinutes | 标签的属性,字典形式组织,格式:.string |
NavigableString | 标签内非属性字符串,<>...中的字符串,格式:.string |
Comment | 标签内字符串的注释部分,一种特殊的Comment类型 |