sklearn之make_blobs：产生数据集

最新推荐文章于 2024-07-15 15:40:17 发布

_BackBackPark

最新推荐文章于 2024-07-15 15:40:17 发布

阅读量1.1k

点赞数

分类专栏： sklearn python 文章标签： sklearn python

本文链接：https://blog.csdn.net/qq_28397005/article/details/120738704

版权

python 同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

sklearn

1 篇文章 0 订阅

订阅专栏

sklearn之make_blobs：产生数据集

作用：产生数值型数据集和标签

官方链接：sklearn之make_blobs

from sklearn.datasets import make_blobs


data, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=3, cluster_std=[0.8, 5])

用法：

n_features表示每一个样本有多少特征值，默认为2
n_samples表示样本的个数，
centers是聚类中心点的个数，可以理解为label的种类数（分类数量），默认3
random_state是随机种子，可以固定生成的数据
cluster_std设置每个类的标准差，，长度与centers数量对应，可以省略
shuffle：是否打乱数据
center_box：数据的上下界

举例：

from sklearn.datasets._samples_generator import make_blobs

data, label = make_blobs(
    n_samples=5,
    n_features=3,
    random_state=112,
    centers=2,
    cluster_std=[0.1,0.5])

data

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PoR6OmNT-1634091801686)(image-20211013101100534.png)]

说明：data有3个特征（n_features=3），样本个数是5（n_samples=5）

label只有0或者1（centers=2），维度是5(n_samples=5)

_BackBackPark

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
sklearn之make_blobs：产生数据集

sklearn之make_blobs：产生数据集作用：产生数值型数据集和标签官方链接：sklearn之make_blobsfrom sklearn.datasets import make_blobsdata, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=3, cluster_std=[0.8, 5])用法：n_features表示每一个样本有多少特征值，默认为2n_samples表示样
复制链接

扫一扫