一、简介
Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.。
Sklearn 包含了很多种机器学习的方式:
- Classification 分类
- Regression 回归
- Clustering 非监督分类
- Dimensionality reduction 数据降维
- Model Selection 模型选择
- Preprocessing 数据预处理
二、sklearn库的结构
(1)结构:
由图中,可以看到库的算法主要有四类:分类,回归,聚类,降维。其中:
常用的回归:线性、决策树、SVM、KNN ;集成回归:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用的分类:线性、决策树、SVM、KNN,朴素贝叶斯;集成分类:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用聚类:k均值(K-means)、层次聚类(Hierarchical clustering)、DBSCAN
常用降维:LinearDiscriminantAnalysis、PCA
(2)图片中隐含的操作流程:
这个流程图代表:蓝色圆圈内是判断条件,绿色方框内是可以选择的算法。你可以根据自己的数据特征和任务目标去找到一条自己的操作路线,一步步做就好了。
三、sklearn库的学习
1.sklearn的官网链接http://scikit-learn.org/stable/index.html#
2.sklearn的API学习链接
原文链接 : http://scikit-learn.org/stable/modules/classes.html
译文链接 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030193
3.sklearn学习的博客连接
https://blog.csdn.net/luanpeng825485697/article/details/78347433
https://blog.csdn.net/fuqiuai/article/details/79495865
https://blog.csdn.net/u010859707/article/details/74995531