最近在看Python for Data Analysis这本书,书中的例子都是基于 Python + Numpy + Pandas + Matplotlib 来实现的,所以在自己的机器上搭个环境是必须的,下面就简单介绍下我搭建的过程。
下载的资源链接
- Python 3.3.5 https://www.python.org/downloads/release/python-335/, 选择 Windows x86 MSI installer
- Numpy 1.8.1 http://sourceforge.net/projects/numpy/files/NumPy/1.8.1/,选择 numpy-1.8.1-win32-superpack-python3.3.exe
- Pandas0.14.0 https://pypi.python.org/pypi/pandas/0.14.0/#downloads, 选择 pandas-0.14.0.win32-py3.3.exe
- Matplotlib 1.3.1 http://matplotlib.org/downloads.html,选择 matplotlib-1.3.1.win32-py3.3.exe
为什么选择Python3.3 的 32 位版本呢
- Numpy官方的windows安装包我只找到 32 位的版本
- Matplotlib官方的windowss安装包只支持到 Python 3.3 的版本
- 最主要的是在windows下如果使用各个第三方库的源码进行编译,会出现各种错误,最简单的办法就是使用安装包安装(而不是使用pip安装)
1、在Python中import numpy时,会出现找不到dateutil这个模块,去 https://pypi.python.org/pypi/python-dateutil 下载该模块使用python安装就好(在解压后的目录中找到 setup.py 使用命令 python setup.py install)
2、在Python中import pandas时,会出现openpyxl的版本不匹配的警告(要求版本大于1.6 小于2.0),这时候我使用pip先卸载对应的openpyxl模块。pip的安装网上已经有很多例子了,简单点说明就是下载setuptools和pip,使用python安装就好
- setuptools 5.4.1 https://pypi.python.org/pypi/setuptools/
- pip 1.5.1 https://pypi.python.org/pypi/pip
安装好后,到python主目录下的Script文件夹中使用命令 pip uninstall openpyxl 就卸载openpyxl模块了。再去https://pypi.python.org/pypi/openpyxl/ 下载一个符合的版本,我使用的是 1.8.6,然后使用python安装就好。
PS:其实第一步的操作可以在安装好pip后,使用 pip install python-dateutil 就可以安装dateutil模块。
都搞定后,使用 pip list 应该可以看到所有安装的模块了
再在python中导入这3个模块,没有问题了。