sklearn.datasets中的几个函数make_moons(), make_circles(), make_classification()

1、make_moons()

sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)

制作月亮型数据。
重要参数:n_samples:设置样本数量、noise:设置噪声、random_state:设置随机参数(嘿嘿,无所谓,随便设),我们主要讲参数noise
(1)将noise设置为0在这里插入图片描述
(2)将noise设置为0.1在这里插入图片描述
我们发现这个noise设置的越大,那么噪声就越大。

2、 make_circles()

sklearn.datasets.make_circles(n_samples=100, shuffle=True, noise=None, random_state=None, factor=0.8)

重要参数:n_samples:设置样本数量、noise:设置噪声、factor:0 < double < 1 默认值0.8,内外圆之间的比例因子、random_state:设置随机参数(嘿嘿,无所谓,随便设),我们主要讲参数noise、factor
(1)将noise设置为0,factor设置为0.1

在这里插入图片描述

(2)将noise设置为0.1,factor设置为0.5

在这里插入图片描述

我们发现这个noise设置的越大,那么噪声就越大,factor设置的越大,两个环就越近。

3、make_classification()

最难了!!!!

sklearn.datasets.make_classification(n_samples=100, n_features=20, n_informative=2,
n_redundant=2, n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None,
flip_y=0.01, class_sep=1.0, hypercube=True,shift=0.0, scale=1.0,
shuffle=True, random_state=None)

功能:生成样本集,通常用于分类算法

参数:

n_features :特征个数= n_informative() + n_redundant + n_repeated
n_informative:多信息特征的个数
n_redundant:冗余信息,informative特征的随机线性组合
n_repeated :重复信息,随机提取n_informative和n_redundant 特征
n_classes:分类类别
n_clusters_per_class :某一个类别是由几个cluster构成的

  • 21
    点赞
  • 76
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值