sklearn中的make_blobs的用法

sklearn中的make_blobs函数主要是为了生成数据集的,具体如下:

调用make_blobs

from sklearn.datasets import make_blobs

make_blobs的用法

data, label = make_blobs(n_features=2, n_samples=100, centers=3, random_state=3, cluster_std=[0.8, 2, 5])

  • n_features表示每一个样本有多少特征值
  • n_samples表示样本的个数
  • centers是聚类中心点的个数,可以理解为label的种类数
  • random_state是随机种子,可以固定生成的数据
  • cluster_std设置每个类别的方差

下面举例说明,相信你一看就懂

'''创建训练的数据集'''
from sklearn.datasets import make_blobs
data, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=2019, cluster_std=[0.6,0.7] )

看看生成的数据集:

data有2个特征(n_features=2),样本个数是100(n_samples=100)
在这里插入图片描述
在这里插入图片描述
再看看生成的label:
label只有0或者1(centers=2),维度是100
在这里插入图片描述
random_state给定数值后,每次生成的数据集就是固定的,方便后期复现,默认的是每次随机生成,要注意一下!!

好了,这样我们就拥有了一个自己想要的数据集,然后就可以开始后续的一些工作了!!!!

  • 48
    点赞
  • 166
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值