sklearn.datasets.make_circles(n_samples = 100,shuffle = True,noise = None,random_state = None,factor = 0.8 )
作用:在2d中创建一个大圆包含小圆的的样本集。
一个简单的数据集,用于可视化聚类和分类算法。
n_samples : int,optional(默认值= 100)
生成的总点数。如果是奇数,则内圆将比外圆具有一个点。
shuffle : bool,optional(默认值= True)
是否洗牌样品。
noise: 双倍或无(默认=无)
高斯噪声的标准偏差加到数据上。
random_state : int,RandomState实例或None(默认)
确定数据集重排和噪声的随机数生成。传递一个int,用于跨多个函数调用的可重现输出。见术语表。
factor : 0 <double <1(默认值= .8)
内圈和外圈之间的比例因子。
返回值
X:[n_samples, 2]形状的数组,生成的样本
y:[n_samples]形状的数组,每个样本的标签(0或1)
shuffle参数
为了便于查看,这里生成6个样本
当shuffle为True时,内外圆的数据是交叉出现
当shuffle为False时,内外圆的数据没有出现交叉
random_state参数
当random_state参数值相同时,生成的样本都相同
当random_state参数值不同时,生成的样本不相同
但是前提是shuffle参数必须为True
noise参数
当noise参数比较小时,取样点比较集中
当noise参数比较大时,取样点比较分散
factor参数
当factor较大时,内圆半径较大
当factor较小时,内圆半径较小
make_moons是函数用来生成2个月亮型数据集,在sklearn.datasets里,具体用法如下:
Parameters:
n_samples : int, optional (default=100)
The total number of points generated.
shuffle : bool, optional (default=True)
Whether to shuffle the samples.
noise : double or None (default=None)
Standard deviation of Gaussian noise added to the data.
random_state : int, RandomState instance or None (default)
Determines random number generation for dataset shuffling and noise. Pass an int for reproducible output across multiple function calls. See Glossary.
Returns:
X : array of shape [n_samples, 2]
The generated samples.
y : array of shape [n_samples]
The integer labels (0 or 1) for class membership of each sample.
主要参数作用如下:
n_numbers:生成样本数量
shuffle:是否打乱,类似于将数据集random一下
noise:默认是false,数据集是否加入高斯噪声
random_state:生成随机种子,给定一个int型数据,能够保证每次生成数据相同。
sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)
for example:
X, y = datasets.make_moons(500, noise=0.5)