转自:微点阅读 https://www.weidianyuedu.com
一、强大的BeautifulSoup:BeautifulSoup是一个可以从html或xml文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。在Python开发中,主要用的是BeautifulSoup的查找提取功能,修改功能很少使用
1、安装BeautifulSoup
pip3 install beautifulsoup4
2、安装第三方html解析器lxml
pip3 install lxml
3、安装纯Python实现的html5lib解析器
pip3 install html5lib
二、BeautifulSoup的使用: