说明:关于用python进行数据分析的学习,我以《利用python进行数据分析》一书作为主要学习对象,并参考相关网络资料。
NumPy
pandas
matplotlib
IPython
SciPy
二、安装和设置
1、安装Xcode: apple store可下载。可惜速度奇慢,最后从学校的紫荆网站上下载的。
2、EPDFree: Enthought Python Distribution 来自Enthought的面向科学计算的python安装包。
目前改名为canopy。可到官网下载。
3、包管理工具:pip
官网: https://pip.pypa.io/en/stable/安装官网说明进行安装。
基本命令:(直接在cmd中输入)
sudo pip install 包名:安装某个包
sudo pip uninstall 包名:卸载某个包
pip list:打开已安装包列表
保存get-pip.py文件,然后到该文件存储的路径下,执行:
sudo python get-pip.py
再执行pip list查看是否安装成功。
如要安装flask:sudo pip install flask
4、安装pandas包:
sudo easy_install pandas (Using /Users/huoyu/Library/Enthought/Canopy_64bit/User/lib/python2.7/site-packages使用的是canopy的包)
亲测也可以使用:sudo pip install pandas,但貌似依赖于canopy中的某些包
验证以上安装是否一切正常:
以pylab模式启动 ipython
在终端输入:ipython —pylab
In [1]: import pandas
In [2]: plot(arange(10))
会加载pandas并绘制一张一条直线的图片。
三、其他
1、集成开发环境IDE,我安装的是PyCharm
2、引入惯例:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
注意:在python软件开发过程中,不建议直接引入类似numpy这种大型库的全部内容,如from numpy import *.