Scikit-learn(简称sklearn)是一个开源的机器学习库,用于Python编程语言。它建立在NumPy、SciPy和matplotlib这些科学计算库之上,提供了一系列强大的工具,使得机器学习任务变得更加容易。这是它的官网:
https://scikit-learn.org/stable/index.html
这是一个专门用来做机器学习的工具包,只要你做机器学习,那么sklearn工具包是用的最多的一个工具。但凡你能想象到的方法,sklearn它都有(除了神经网络)。如上图,它有六大模块:分类、回归、聚类、降维算法、模型选择和数据预处理。sklearn几乎包含了机器学习的全过程。
那么如何使用呢?官网上方有API文档,API中详细说明了每个模块具体是怎么做的
比如图中的config_context,其API详细讲解了每个参数是如何调用的,还有相应的例子帮助理解
除此之外,sklearn还提供了海量的examples,里面包含了所有的代码(甚至介绍了每步代码做了什么事)
sklearn的examples有许多的图例,我们可以直接我们自己的数据代入到examples的模板中,就不用自己想图究竟怎么画了。
sklearn也提供了许多的数据集,有需要也可以直接下载使用