Beautiful Soup库的用法（含实例）

最新推荐文章于 2024-07-04 22:59:03 发布

唱戏先生

最新推荐文章于 2024-07-04 22:59:03 发布

阅读量260

点赞数

分类专栏： Python网络爬虫与信息提取

本文链接：https://blog.csdn.net/qq_43131852/article/details/102560256

版权

本文介绍了Beautiful Soup库的安装、使用及解析器选择。详细讲解了Beautiful Soup类的基本元素，包括HTML的下行、上行和平行遍历方法，以及内容查找策略。并提供了具体的‘中国大学排名定向爬虫’实例，演示了库的应用。

摘要由CSDN通过智能技术生成

在命令台执行pip insatll beautifulsoup4，可以使用镜像模式下载。

from bs4 import BeautifulSoup
soup = BeautifulSoup('<p>data</p>','html.parser')

data为解析的内容，html.parser为解析器。

解析器	使用方法	条件
bs4的HTML解析器	BeautifulSoup(mk,‘html.parser’)	安装bs4库
lxml的HTML解析器	BeautifulSoup(mk,‘lxml’)	pip install lxml
lxml的XML解析器	BeautifulSoup(mk,‘xml’)	pip install lxml
html5lib的解析器	BeautifulSoup(mk,html5lib’)	pip install html5lib