本文记录一下Ubuntu下安装python关于数据处理的各种包,安装的方法都非常简单,直接使用apt-get
1.ipython工具
ipython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。
sudo apt-get install ipython
2.安装scipy,numpy,matplotlib
NumPy系统是Python的一种开源的数字扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。据说NumPy将Python相当于变成一种免费的更强大的Matlab系统。
SciPy是一个开源的Python算法库和数学工具包。
matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。
sudo apt-get install python-scipy
sudo apt-get install python-numpy
sudo apt-get install python-matplotlib
3.安装Pandas
Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
sudo apt-get install python-pandas
4.安装python机器学习工具
首先是著名的开源ML工具包scikit-learn,这个工具的文档非常详细
sudo apt-get install python-sklearn
gensim,这个包是做文本分析用的,它包含了一些基础的文本处理,和一些模型,LSI,LDA。
官网点击打开链接 ,使用pip,或easy_install安装,或者直接下载源码包
sudo python setup.py install