Python本身的数据分析本身的数据分析功能并不强,需要安装一些第三方扩展库来增强它的能力.
目前主流的有以下部分:
- Numpy
- 提供数组支持,高效的处理函数
- https://docs.scipy.org/doc/numpy-dev/user/
- Scipy
- 提供矩阵支持,矩阵相关的计算模块
- http://scipy.github.io/devdocs/
- Matplotlib
- Pandas
- StatsModels
- 统计建模和计量经济学,包括描述统计,统计模型估计,推断
- http://www.statsmodels.org/stable/gettingstarted.html
- Scikit-Learn
- 支持回归,分类,聚类等机器学习库
- http://scikit-learn.org/stable/auto_examples/index.html
- Keras
- 深度学习库,用于建立神经网络和深度学习模型
- http://keras-cn.readthedocs.io/en/latest/
- Gensim
安装
安装的话,建议先安装anaconda,windows环境搭建步骤:
http://blog.csdn.net/m0_37681914/article/details/73609177
anaconda自带Numpy ,Scipy ,Matplotlib ,Pandas ,Scikit-Learn
然后安装keras步骤如下:
http://blog.csdn.net/m0_37681914/article/details/73609234
安装gensim非常简单:
在cmd下输入命令:
pip install gensim
合抱之木,生于毫末;九层之台,起于垒土;千里之行,始于足下。