一、当使用datasets里的数据集时:
dataset.load_xx: 从数据集中下载数据
1、实例:
from sklearn import datasets
iris = datasets.load_iris()
iris_X = iris.data # iris属性
iris_y = iris.target # iris类别
2、通常套路:
- load=datasets.load_xx (某数据集)
- X=load.data(各种属性);
- y=load.target(类别即标签)
二、当生成数据集时:
dataset.make_xx: 创造数据集供自己使用
1、实例:
from sklearn import datasets
X, y = datasets.make_regression(n_samples=100, n_features=1, n_targets=1, noise=50)
plt.scatter(X, y)
plt.show()
其中:
n_samples表示样本的个数
n_features表示每一个样本有多少特征值
n_targets表示类别
noise值越大,图像越离散
X : array of shape [n_samples, n_features] The generated samples. 生成的样本数据集。
y : array of shape [n_samples] The integer labels for cluster membership of each sample. 样本数据集的标签。