1.Pandas:pip install pandas
Pandas是python的一个数据分析包,是基于Numpy的一种工具,纳入了大量库和一些标准的数据模型。提供了高效操作大型数据集所需的工具,提供了大量能使我们快速便捷地处理数据的函数和方法。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。它是使Python成为强大而高效的数据分析环境的重要因素之一。
2.Numpy
NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy内部解除了Python的PIL(全局解释器锁),运算效率极好,是大量机器学习框架的基础库。下面是一个创建简单数组的例子:
3.Matplotlib
matplotlib是一个在Python下的2d绘图库,尽管它的起源是仿MATLAB的图形命令,但是与MATLAB不相关,并且是以对象对象方式,运行于Python环境下。尽管mapplotlib主要都是用纯Python写的,但是为了在运行时有更高的性能,特别是在显示大量数组数据的情况下,里面也大量使用了NumPy和其他的扩展代码。
4.sklearn
Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式:分类(Classification)和回归(Regression),常用的分类器包括SVM、KNN、贝叶斯、线性回归、逻辑回归、决策树、随机森林、xgboost、GBDT、boostin