sklearn.datasets中的几个函数make_moons(), make_circles(), make_classification()

最新推荐文章于 2025-03-18 10:44:13 发布

佛系小狼

最新推荐文章于 2025-03-18 10:44:13 发布

阅读量9.6k

点赞数 22

分类专栏： sklearn python 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44805104/article/details/105266048

版权

python 同时被 2 个专栏收录

20 篇文章

订阅专栏

4 篇文章

订阅专栏

1、make_moons()

sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)

制作月亮型数据。

重要参数：n_samples：设置样本数量、noise:设置噪声、random_state：设置随机参数（嘿嘿，无所谓，随便设），我们主要讲参数noise

（1）将noise设置为0

（2）将noise设置为0.1

我们发现这个noise设置的越大，那么噪声就越大。

2、 make_circles()

sklearn.datasets.make_circles(n_samples=100, shuffle=True, noise=None, random_state=None, factor=0.8)

重要参数：n_samples：设置样本数量、noise:设置噪声、factor：0 < double < 1 默认值0.8，内外圆之间的比例因子、random_state：设置随机参数（嘿嘿，无所谓，随便设），我们主要讲参数noise、factor

（1）将noise设置为0，factor设置为0.1

在这里插入图片描述

（2）将noise设置为0.1，factor设置为0.5

在这里插入图片描述

我们发现这个noise设置的越大，那么噪声就越大，factor设置的越大，两个环就越近。

3、make_classification()

最难了！！！！

sklearn.datasets.make_classification(n_samples=100, n_features=20, n_informative=2,
n_redundant=2, n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None,
flip_y=0.01, class_sep=1.0, hypercube=True,shift=0.0, scale=1.0,
shuffle=True, random_state=None)

功能：生成样本集，通常用于分类算法

参数：

n_features :特征个数= n_informative（） + n_redundant + n_repeated
n_informative：多信息特征的个数
n_redundant：冗余信息，informative特征的随机线性组合
n_repeated ：重复信息，随机提取n_informative和n_redundant 特征
n_classes：分类类别
n_clusters_per_class ：某一个类别是由几个cluster构成的

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。