以安装Beautifulsoup4(bs4)为例:
【扩展阅读】
Beautiful Soup是一个Python的一个库,主要为一些短周期项目比如屏幕抓取而设计。有三个特性使得它非常强大:
1.Beautiful Soup提供了一些简单的
方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。
2.Beautiful Soup自动将输入文档转换为Unicode编码,并将输出文档转化为UTF-8编码。你不需要考虑编码,除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到,这时你需要指出原来的编码方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上层,这允许你使用不同的解析策略或者牺牲速度来换取灵活性。
Beautiful Soup解析你提哦那个的任何东西,并且替你完成树的便利。你可以告诉它“查找所有的链接” 或者“查找类externalLink的所有链接”或者“查找所有url地址匹配foo.com的链接”或者“查找使用粗体的表头,返回那些粗体的文本”。
在一些设计不良的网站上很难获取的宝贵的数据,使用Beautiful Soup便可以获得。 原先需要运行几个小时工程,使用Beautiful Soup仅需要几分钟而已。
环境:
- Windows10电脑 ;
- Python2.7.11
第1步:
到网站上下载:http://www.crummy.com/software/BeautifulSoup/bs4/download/
第2步:
解压文件到D:\Python27 (我的Python安装在D盘)
第3部:
cmd运行D:\Python27\BeautifulSoup4-4.5.1>Python setup.py build(根据自己解压缩后的目录和下载的版 本号修改;我下载的版本为4.5.1,直接进入到刚解压的目录中执行就可以了。)
第4步:
cmd运行D:\Python27\BeautifulSoup4-4.5.1>Python setup.py install
第5步:
测试一下是否能导入:
在IDE下
>>> import bs4
>>>
没有报错说明安装成功。
如果不能导入,会提示:ImportError: No module named bs4