sklearn.datasets.make_circles（）函数和make_moons()函数

zjz_xn

已于 2022-02-14 14:25:58 修改

阅读量2.8k

点赞数 4

分类专栏：神经网络文章标签： sklearn 聚类机器学习

于 2022-02-09 19:45:49 首次发布

原文链接：https://jingyan.baidu.com/article/b2c186c81e8fa6c46ff6ff5b.html

版权

神经网络专栏收录该内容

31 篇文章 3 订阅

订阅专栏

sklearn.datasets.make_circles（n_samples = 100，shuffle = True，noise = None，random_state = None，factor = 0.8 )
作用：在2d中创建一个大圆包含小圆的的样本集。

一个简单的数据集，用于可视化聚类和分类算法。

	n_samples ： int，optional（默认值= 100）
	生成的总点数。如果是奇数，则内圆将比外圆具有一个点。
	
	shuffle ： bool，optional（默认值= True）
	是否洗牌样品。
	
	noise： 双倍或无（默认=无）
	高斯噪声的标准偏差加到数据上。
	
	random_state ： int，RandomState实例或None（默认）
	确定数据集重排和噪声的随机数生成。传递一个int，用于跨多个函数调用的可重现输出。见术语表。
	
	factor ： 0 <double <1（默认值= .8）
	内圈和外圈之间的比例因子。

返回值
X：[n_samples, 2]形状的数组，生成的样本

y：[n_samples]形状的数组，每个样本的标签（0或1）

shuffle参数

为了便于查看，这里生成6个样本

当shuffle为True时，内外圆的数据是交叉出现

当shuffle为False时，内外圆的数据没有出现交叉
在这里插入图片描述

random_state参数

当random_state参数值相同时，生成的样本都相同

当random_state参数值不同时，生成的样本不相同

但是前提是shuffle参数必须为True
在这里插入图片描述

noise参数

当noise参数比较小时，取样点比较集中

当noise参数比较大时，取样点比较分散
在这里插入图片描述

factor参数

当factor较大时，内圆半径较大

当factor较小时，内圆半径较小
在这里插入图片描述

make_moons是函数用来生成2个月亮型数据集，在sklearn.datasets里，具体用法如下：

Parameters:	

n_samples : int, optional (default=100)

    The total number of points generated.
shuffle : bool, optional (default=True)

    Whether to shuffle the samples.
noise : double or None (default=None)

    Standard deviation of Gaussian noise added to the data.
random_state : int, RandomState instance or None (default)

    Determines random number generation for dataset shuffling and noise. Pass an int for reproducible output across multiple function calls. See Glossary.

Returns:	

X : array of shape [n_samples, 2]

    The generated samples.
y : array of shape [n_samples]

    The integer labels (0 or 1) for class membership of each sample.

主要参数作用如下：
n_numbers:生成样本数量

shuffle:是否打乱，类似于将数据集random一下

noise:默认是false，数据集是否加入高斯噪声

random_state:生成随机种子，给定一个int型数据，能够保证每次生成数据相同。

sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)
for example:

X, y = datasets.make_moons(500, noise=0.5)