bs4安装过程

这里描述Windows下面的安装过程。

下载

搜索bs4可以找到官网,比如找到这个https://www.crummy.com/software/BeautifulSoup/bs4/doc/,然后可以下载/安装的地方https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-beautiful-soup,最后下载源码:beautifulsoup4-4.1.0.tar.gz

解压缩

随便找个解压缩工具解压缩即可。

安装

cd到源代码目录下,执行 python setup.py install命令即可,详细过程如下。命令执行完之后,多了一个build目录,进一步地,是build/lib/bs4/目录。

D:\YourDir>cd beautifulsoup4-4.1.0

D:\YourDir\beautifulsoup4-4.1.0>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 FFFF-FFFF

 D:\YourDir\beautifulsoup4-4.1.0 的目录

2016/04/07  18:50    <DIR>          .
2016/04/07  18:50    <DIR>          ..
2016/04/07  18:50    <DIR>          beautifulsoup4-4.1.0
               0 个文件              0 字节
               3 个目录 204,626,579,456 可用字节

D:\YourDir\beautifulsoup4-4.1.0>cd beautifulsoup4-4.1.0

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 FFFF-FFFF

 D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0 的目录

2016/04/07  18:50    <DIR>          .
2016/04/07  18:50    <DIR>          ..
2012/03/01  23:37             1,747 AUTHORS.txt
2016/04/07  18:50    <DIR>          bs4
2012/03/14  22:27             1,263 COPYING.txt
2016/04/07  18:50    <DIR>          doc
2012/05/30  01:22            32,832 NEWS.txt
2012/05/30  01:30               912 PKG-INFO
2012/02/20  23:02             1,517 README.txt
2016/04/07  18:50    <DIR>          scripts
2012/05/30  01:23             1,323 setup.py
2012/04/27  22:16             1,091 TODO.txt
               7 个文件         40,685 字节
               5 个目录 204,626,579,456 可用字节

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0>python setup.py install
running install
running build
.......
byte-compiling D:\Python27\Lib\site-packages\bs4\__init__.py to __init__.pyc
running install_egg_info
Writing D:\Python27\Lib\site-packages\beautifulsoup4-4.1.0-py2.7.egg-info

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 FFFF-FFFF

 D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0 的目录

2016/04/07  18:51    <DIR>          .
2016/04/07  18:51    <DIR>          ..
2012/03/01  23:37             1,747 AUTHORS.txt
2016/04/07  18:50    <DIR>          bs4
2016/04/07  18:51    <DIR>          build
2012/03/14  22:27             1,263 COPYING.txt
2016/04/07  18:50    <DIR>          doc
2012/05/30  01:22            32,832 NEWS.txt
2012/05/30  01:30               912 PKG-INFO
2012/02/20  23:02             1,517 README.txt
2016/04/07  18:50    <DIR>          scripts
2012/05/30  01:23             1,323 setup.py
2012/04/27  22:16             1,091 TODO.txt
               7 个文件         40,685 字节
               6 个目录 204,625,461,248 可用字节

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0>cd build

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 FFFF-FFFF

 D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build 的目录

2016/04/07  18:51    <DIR>          .
2016/04/07  18:51    <DIR>          ..
2016/04/07  18:51    <DIR>          lib
               0 个文件              0 字节
               3 个目录 204,625,461,248 可用字节

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build>cd lib

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build\lib>dir
 驱动器 D 中的卷没有标签。
 卷的序列号是 FFFF-FFFF

 D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build\lib 的目录

2016/04/07  18:51    <DIR>          .
2016/04/07  18:51    <DIR>          ..
2016/04/07  18:51    <DIR>          bs4
               0 个文件              0 字节
               3 个目录 204,625,461,248 可用字节

D:\YourDir\beautifulsoup4-4.1.0\beautifulsoup4-4.1.0\build\lib>

把生成的bs4拷贝到pyhon的lib目录下

把前面生成的/build/lib/目录下面的bs4整个文件夹拷贝到python的lib目录下,如D:\Python27\Lib。

验证

cmd关掉,重新打开,执行python命令。参考前面bs4的README.txt中的内容,执行如下命令:

D:\>python
Python 2.7 (r27:82525, Jul  4 2010, 09:01:59) [MSC v.1500 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup("<p>Some<b>bad<i>HTML")
>>> print soup.prettify()
<p>
 Some
 <b>
  bad
  <i>
   HTML
  </i>
 </b>
</p>
>>> soup.find(text="bad")
u'bad'
>>> soup.i
<i>HTML</i>
>>>

html5lib & six

在某些Windows平台上,bs4会提示HTMLParser有问题,提示安装html5lib,进而需要six。

这两个包的安装方法和上面的bs4一样,不再详述。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值