python数据分析工具安装教程
python本身的数据分析功能不强,需要安装一些第三方扩展库来增强它的能力,介绍两种方法:
- 洁净Python3.X自行安装库(注意有安装的先后顺序)在cmd的窗口中运行python后执行或在pycharm的Ter窗口中执行
1.1安装Numpy: numpy实现了真正的数组功能,后面介绍的Scipy, Matplotlib, Pandas等库都依赖它。通过pip安装:pip install numpy
1.2安装Scipy:Scipy提供了真正的矩阵以及大量基于矩阵运算的对象和函数,它依赖于Numpy,安装方式:pip install Scipy
1.3安装Matplotlib: 一种绘图库,实现可视化,安装方式:pip install Matplotlib
1.4安装Pandas:Python下最强大的数据分析和探索工具,安装方式:pip install Pandas,默认的Pandas还不能读写Excel文件,需要安装xlrd(读)和xlwt(写)库才能支持Excel的读写。 pip install xlrd pip install xlwt
1.5安装StatsModels:Pandas着眼于数据的读取、处理和探索,而StatsModels更加注重数据的统计建模分析,它依赖于pandas,安装方式:pip install StatsModels
1.6安装Scikit-Learn:这是一个机器学习相关的库,包括数据预处理、分类、回归、聚类、预测和模型分析等,它依赖于Numpy,Scipy和Matplotlib,安装方式: pip install Scikit-Learn。
1.7安装Keras: Scikit-Learn虽然足够强大,但是它并没有包括一个强大的模型-人工神经网络。Keras并非简单的神经网络库,而是一个基于Theano的强大的深度学习库,利用它不仅可以搭建普通的神经网络,还可以搭建各种深度学习模型,如自编码器、循环神经网络、递归神经网络、卷积神经网络等。安装Keras之前需要安装Numpy,Scipy和Theano。安装Thearo需要准备一个C++编译器,Widows环境下一般而言要先安装MinGW然后再安装Theano。 安装方式:pip install keras
1.8安装Gensim:用于处理语言方面的任务,如文本相似度计算、LDA、Word2Vec等。它依赖于Numpy和smart_open。安装方式:pip install --upgrade gensim
2.直接安装Anaconda