scikit-learn(简记 sklearn),是面向 Python 的免费机器学习库。
sklearn 包含了很多种机器学习的方式:如分类、回归、聚类算法,SVM、随机森林、K-means 等,降维、模型选择和数据预处理等机器学习算法。sklearn 支持 NumPy 和 SciPy 数据结构,以及 Matplotlib 库。
注意:scikit-learn 库与 NumPy 库相同,也需要单独安装。
sklearn 是机器学习中一个常用的 python 第三方模块,它建立在 NumPy,SciPy 和 Matplotlib 模块之上能够为用户提供各种机器学习算法接口,可以让用户简单、高效地进行数据挖掘和数据分析。
sklearn 能够使用同样的接口来实现所有不同的算法调用。在进行机器学习任务时,并不需要每个人都实现所有的算法,只需要简单的调用 sklearn 里的模块就可以实现大多数机器学习任务。
这套 scikit-learn 教程,它将教会你如何利用 scikit-learn 库实现简单机器学习的程序。