sklearn之make_blobs:产生数据集
作用:产生数值型数据集和标签
官方链接:sklearn之make_blobs
from sklearn.datasets import make_blobs
data, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=3, cluster_std=[0.8, 5])
用法:
- n_features表示每一个样本有多少特征值,默认为2
- n_samples表示样本的个数,
- centers是聚类中心点的个数,可以理解为label的种类数(分类数量),默认3
- random_state是随机种子,可以固定生成的数据
- cluster_std设置每个类的标准差,,长度与centers数量对应,可以省略
- shuffle:是否打乱数据
- center_box:数据的上下界
举例:
from sklearn.datasets._samples_generator import make_blobs
data, label = make_blobs(
n_samples=5,
n_features=3,
random_state=112,
centers=2,
cluster_std=[0.1,0.5])
data
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PoR6OmNT-1634091801686)(image-20211013101100534.png)]
说明:data有3个特征(n_features=3),样本个数是5(n_samples=5)
label只有0或者1(centers=2),维度是5(n_samples=5)