Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。美中不足的是我们需要自己去安装这个模块,下面讲一下他的安装步骤。
Windows下安装
-
去beautiful soup官网上去下载最新版本是4.3.0。.http://www.crummy.com/software/BeautifulSoup/bs4/download/下载
-
下载完成之后需要解压缩,假设放到python安装目录下。
-
运行cmd,切换到D:/python/beautifulsoup4-4.1.3/目录下(根据自己解压缩后的目录和下载的版本号修改),
cd C:\Python27\beautifulsoup4-4.3.0\
-
运行 python setup.py build
-
python setup.py install (部分帖子没有写明前面的python 会出错)
-
然后输入python,进入python模块
然后输入from bs4 import BeautifulSoup检测是否成功。
如下图,显然成功了
END
Linux下安装
-
Linux相对于就简单多了。进入beautifulsoup4-4.3.0目录,然后在命令行输入python setup.py install
或者sudo python setup.py install
-
然后安装成功,接着检测下
然后输入python,进入python模块
然后输入from bs4 import BeautifulSoup检测是否成功。
如下图,显然成功了
-
这样windows和linux的安装就ok了