一、SKLearn算法库的顶层设计
(一)SKLearn的模块
1.监督学习模块
2.无监督学习模块
3.数据变换模块
(二)SKLearn中算法的继承关系
1.基类
2.分类器继承关系图
3.聚类继承关系图
4.特征提取继承关系图
5.六大板块统一API
6.监督学习工作流程:
7.无监督学习工作流程:
(1).数据预处理工作流程:数据变换
(2).无监督学习工作流程:聚类
二、SKLearn数据集操作API
三、SKLearn常用数据集
1.自带的小数据集(sklearn.datasets.load_)
(1)鸢尾花数据集
(2)手写数字数据集:
(3)乳腺癌数据集
(4)糖尿病数据集
(5)波士顿房价数据集
(6)体能训练数据集
2.svmlight/libsvm格式数据集(sklearn.datasets.load__svmlight_file(…))
3.可在线下载的数据集
(1)20类新闻文本数据集:
(2)野外带标记人脸数据集:
(3)Olivetti人脸数据集:
(4)rcv1多标签数据集:
4.计算机生成的数据集(sklearn.datasets.make_)
(1)用于分类和聚类任务:这些函数产生样本特征向量矩阵以及对应的类别标签集合
代码如下:
用于多标签分类任务:
(2)用于回归任务:
(3)用于流形学习:
(4)用于因
SKLearn工具学习(2)
最新推荐文章于 2022-08-30 12:00:09 发布