关于make_blobs的文档
import sklearn.datasets as ds
help(ds.make_blobs)
Generate isotropic Gaussian blobs for clustering.
make_blobs的主要作用是处理数据,生成高斯分布的数据,以便于用于聚类。
参数:
n_samples: int类型,默认100,用于聚类的所有样本总数。
n_features: int类型,默认2,每个类的特征数。
centers:int类型,或者 形如[n_center, n_features]的array类型,默认3. 生成的中心点的数(即K数),或固定的中心位置。
cluster_std: float类型,或者 float序列类型,默认1.0。聚类的标准差(使用float序列时,每个类的标准差不同,聚类结果不同)。
center_box: 一对float类型,默认(-10.0,10.0)。当中四年center随机生成时,每个聚类簇的中心的边界(设定了簇范围)。
shuffle: boolean类型,默认True。打乱样本。
random_state:随机种子。
返回:
X:生成的样本结果,形如[n_samples, n_features]的数组,行为样本,列为样本特征。
y: 每个样本分类结果,用整数来作为标签。