Windows平台Python的一些外部模块的安装:
Python包仓库
https://pypi.python.org/pypi
可搜索需要的包。
准备pip:
一般在使用python**.msi安装包安装时已经勾选安装pip了。
D:\Python34\Scripts\
加入PATH路径使CMD命令行可用pip
命令(可在配置Python的PATH时,一起配置之)pip的升级与重新安装,例如被提示
You are using pip version 6.0.8, however version 7.1.2 is available.
You should consider upgrading via the ‘pip install –upgrade pip’ command.
在命令行下,按照提示运行pip install --upgrade pip
有时却遇到旧版本pip被自动卸载,而新版本pip安装失败。这时手动安装:
在官网 (https://pypi.python.org/pypi/pip/) 打开Installation
链接 (https://pip.pypa.io/en/stable/installing/) ,看到有一种安装方法是
下载
get-pip.py
文件,然后(不需要管理员模式)命令行python get-pip.py
即可网络在线安装pip了。
常见安装问题的可能原因
在使用源代码手动方式安装时,有些模块的源代码包解压缩后,所在路径名称很长,在Windows平台如果路径名过长有时会出现install失败,可以将路径名改短尝试。
列出已安装的包
pip list
requests的安装
pip在线安装方式:
pip install requests
下载源代码包方式,解压:
python setup.py install
bs4即Beautiful Soup的安装
pip在线安装方式:
pip install beautifulsoup4
下载源代码包方式,解压:
python setup.py install
卸载
pip uninstall beautifulsoup4
说明:HTML解析器,虽然BeautifulSoup官方文档中推荐使用lxml,原因是速度快。但实际使用中还是建议用 html5lib,原因就是其最接近以浏览器的方式解析文档,容错性最好,缺点就是速度慢些。但这总比解析出现莫名其妙问题再人工debug更省时间省精力。(实际使用过程中就遇到过lxml解析丢失内容的情况)
html5lib的安装
- pip在线安装方式:
pip install html5lib
lxml的安装:
Windows平台不建议使用pip命令pip install lxml
在线安装lxml。
在http://lxml.de/installation.html#installation 中已说明 MS Windows 平台可以考虑使用已经编译好的包,下载 **.whl 时注意选择对应Python的版本。例如
pip install lxml-3.4.4-cp34-none-win32.whl
(对应CPython3.4版本win32平台)