1、sklearn数据集
(1) 数据的划分和介绍
机器学习中一般将数据集划分为两个部分:
训练数据:用于训练,构建模型。
测试数据:在模型检验时使用,用于评估模型是否有效
(2)数据集划分API
sklearn.model_selection.train_test_split
# 分割数据集到训练集合,测试集合.数据随机切分 |
(3)Sklearn数据集API介绍
Sklearn分类数据集:
Sklearn回归数据集:
2、转换器与估计器
(1)转换器:fit_transform()
(2)估计器(estimator)
在sklearn中,估计器是一类实现了算法的API。
- 用于分类的估计器:
sklearn.neighbors # k-近邻算法
sklearn.naive_bayes # 贝叶斯
sklearn.linear_model.LogisticRegression #逻辑回归
sklearn.tree #决策树与随机森林
- 用于回归的估计器:
sklearn.linear_model.LinearRegression #线性回归
sklearn.linear_model.Ridge # 岭回归