一 Beautiful Soup的介绍
官网介绍:Beautiful Soup是一个可以从HTML或者XML文件中提取数据的Python库,能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式,Beautiful Soup 会帮你节省数小时甚至数天的工作时间。
简而言之:就是一种强大的解析工具,帮助我们从网页中提取数据时提高效率。
【tips】: BeautifulSoup自动将输入文档转换为Unicode编码, 输出文档转换为utf-8编码。
二 安装
推荐使用pip来安装:
pip install beautifulsoup4
验证是否安装成功(在解释器导入模块不报错即安装成功):
【tips】: 这里虽然安装的是beautifulsoup4这个包,但是在引用的时候是引入bs4,因为这个包源代码本身的库文件夹名称就是 bs4 。
三 Beautiful Soup 的解析器比较