数据分析的流程
python数据分析常用库
IPython
Numpy——科学计算的基础包
- 对数组的计算
- 线性代数运算、傅里叶变换和随机数生成功能
Scipy——专门解决科学计算中各种标准问题域的模块的集合
主要包含8个子模块,相对应有不同的应用:插值、积分、优化、图像处理和特殊函数等
Pandas
- 索引功能
- 关系型数据库进行关联
Matplotlib——绘制数据图标的Python库
- 2D绘图库
scikit-learn——数据挖掘和数据分析工具
- 谷歌开发,能够解决大部分数据量不大情况下的的数据分析和挖掘问题
- 基本模块主要有数据预处理模型选择、分类、聚类、数据降维和回归6个
Spyder——交互式Python语言开发环境
- 可用于将调试控制台直接集成到图形用户界面的布局
- 模仿MATLAB的“工作空间”,可以方便观察和修改数组值