1. 简介
Beautiful Soup(美丽汤)
是一个Python第三方
库,用于从HTML和XML文件中提取数据。它与您最喜欢的解析器一起使用,提供了导航
,搜索
和修改解析树
的惯用方式,点击此处进入官网。最新版本Beautiful Soup 4
简称bs4
。优势:相比于ET
库, 功能更全,可以选择解析器来解析文档,既支持html, 也支持xml,容错度(简单理解为文档格式自动补全功能)也更高,API也很好用。
2. 安装
2.1 库本身的安装
命令安装格式如下:
pip install --user -i http://pypi.douban.com/simple --trusted-host pypi.douban.com beautifulsoup4
使用Pycharm图形化界面安装如下:
2.2 解析器的安装
把指定内容,转换成可解析的对象,不同的解析器ÿ