sklearn--make_blobs函数及相应参数简介

make_blobs方法:

sklearn.datasets.make_blobs(n_samples=100,n_features=2,centers=3, cluster_std=1.0,center_box=(-10.0,10.0),shuffle=True,random_state=None)

make_blobs函数是为聚类产生数据集,产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:是每个样本的特征(或属性)数,也表示数据的维度,默认值是2
centers:表示类别数(标签的种类数),默认值3
cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0],浮点数或者浮点数序列,默认值1.0
center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
shuffle :将数据进行洗乱,默认值是True
random_state:官网解释是随机生成器的种子,可以固定生成的数据,给定数之后,每次生成的数据集就是固定的。若不给定值,则由于随机性将导致每次运行程序所获得的的结果可能有所不同。在使用数据生成器练习机器学习算法练习或python练习时建议给定数值。

例如:在jupyter notebook中可以简单练习一下。

 

 

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: sklearn.datasets.make_blobs是一个函数,用于生成随机的多维高斯分布据集。该函数可以用于测试和演示机器学习算法。它可以生成指定量的样本,每个样本有多个特征,每个特征的分布可以指定。生成的据集可以用于聚类、分类等任务。 ### 回答2: make_blobs是Scikit-learn中的一个函数,用于生成具有指定特征和簇的模拟据集。该函数可以用来生成聚类任务的测试据。 make_blobs函数的主要参数包括n_samples(样本量),n_features(特征量),centers(簇的量或中心点的坐标),cluster_std(簇的标准差)和random_state(随机种子)。其中,n_samples表示生成的样本目,n_features表示每个样本的特征目,centers表示簇中心点的量或坐标,cluster_std表示簇的标准差,random_state表示随机种子,用于固定据生成的随机过程。 通过调用make_blobs函数,可以生成一个样本为n_samples,特征为n_features的据集。据集的特征是由均值为centers,标准差为cluster_std的高斯分布生成的。通过指定centers参数,可以生成不同中心点的簇,这样可以根据生成的据集进行聚类算法的测试。 例如,如果我们调用make_blobs函数生成一个含有2个簇,每个簇包含100个样本,特征为2的据集,代码如下: X, y = make_blobs(n_samples=200, n_features=2, centers=2, cluster_std=1.0, random_state=0) 生成的X是一个形状为(200, 2)的组,表示200个样本,每个样本具有2个特征。y是一个保存了每个样本所属簇的组,其中的值为0或1。 make_blobs函数的输出可以用于聚类算法的训练和评估。例如,可以使用K-means算法对生成的据进行聚类,然后与真实的簇分配进行比较,以评估聚类算法的性能。 综上所述,make_blobs是一个用于生成模拟聚类任务据集的函数,可以通过调整其参数来生成具有不同特征和簇据集,从而用于测试聚类算法的性能和效果。 ### 回答3: make_blobs是scikit-learn库中的一个据生成函数,用于生成具有指定特征量和聚类量的样本据。它广泛用于机器学习和据挖掘领域中的算法测试和模型评估。 make_blobs函数参数包括n_samples(生成样本),n_features(生成样本的特征),centers(聚类中心),cluster_std(聚类标准差),center_box(聚类中心的边界范围)等。 通过设定n_samples、n_features和centers参数的值,可以生成多个簇的样本据。每个簇的据点是通过从center_box中随机选择聚类中心,并在各个维度上根据cluster_std参数的高斯分布随机生成的。 make_blobs函数返回一个包含生成据点和相应标签的元组。据点是一个组,其形状为(n_samples, n_features),表示每个样本的特征向量。标签是一个组,其形状为(n_samples,),表示每个样本所属的簇。 使用make_blobs生成的据可以用于各种机器学习算法的示例和测试。比如,可以用生成的据训练一个聚类算法,然后将新据点分配到指定的簇中。此外,还可以通过对生成的据进行可视化,观察聚类效果。 make_blobs函数的应用非常广泛,在教学及实际应用中经常使用。它可以帮助我们理解和学习不同算法的性能和特点,以及评估算法在处理不同据集上的表现。总之,make_blobs是一个非常实用的据生成函数,方便、灵活,极大地方便了机器学习和据挖掘的实验和研究工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值