sklearn简介
- scikit-learn,又称sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。
- sklearn是数据挖掘和数据分析的一个工具,基本模块主要有数据预处理、模型选择、分类、聚类、数据降维和回归 6 个,在数据量不大的情况下,scikit-learn可以解决大部分问题。
- sklearn的官网链接
- sklearn有一个完整而丰富的官网,里面讲解了基于sklearn对所有算法的实现和简单应用。对于基础的机器算法的使用,我们只需要了解在这个库中不同的机器学习算法有哪些可调参数,有哪些可用接口,这些接口和参数对算法来说有什么含义,又会对算法的性能及准确性有什么影响即可。