1. 最基本的有三种解析器。
默认为 html.parser。
官方文档推荐 lxml(解析速度快,但遇到 </html> 则终止,无法解析其后内容,与 urlopen 配合使用可解决,但仍存在解析不完全的情况)。
官方文档推荐 html5lib(解析最全,但速度极慢,大约是 lxml 解析速度的 4 到 5 倍)。2. 参考文档,关于BeautifulSoup4 解析器的说明。
1. 最基本的有三种解析器。
默认为 html.parser。
官方文档推荐 lxml(解析速度快,但遇到 </html> 则终止,无法解析其后内容,与 urlopen 配合使用可解决,但仍存在解析不完全的情况)。
官方文档推荐 html5lib(解析最全,但速度极慢,大约是 lxml 解析速度的 4 到 5 倍)。2. 参考文档,关于BeautifulSoup4 解析器的说明。