人工数据集

本文介绍了sklearn.datasets模块中用于生成人工数据集的函数,包括make_moons(), make_circles(), make_classification()和make_blobs()。通过调整参数如噪声、内外圆比例、特征数量等,可以创建不同复杂度的样本集,适用于机器学习算法的训练和测试。重点关注了noise和factor参数对数据分布的影响。" 22575617,1397161,自定义类加载器与加密类管理,"['Java', '类加载器', '加密技术', '程序设计', '软件工程']
摘要由CSDN通过智能技术生成

一:月亮数据集-make_moons

sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)

重要参数:n_samples:设置样本数量、noise:设置噪声、random_state:设置随机参数(嘿嘿,无所谓,随便设),我们主要讲参数noise

#导入必要库
from sklearn.datasets import  make_moons
import numpy as np
from numpy import where
import matplotlib.pyplot as plt

X, yy = make_moons(n_samples=200, random_state=123,noise=0.02) #噪声为0.02
#绘图
# 为每个类的样本创建散点图
for class_value in range(2):
# 获取此类的示例的行索引
    row_ix = where(yy == class_value)
# 创建这些样本的散布
    plt.scatter(X[row_ix, 0], X[row_ix, 1])  #什么意思?
# 绘制散点图
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-stFFM68b-1682308408909)(output_1_0.png)]

1:比较不同噪声的影响

# 月亮数据集
plt.figure(figsize=(7,7))
plt.subplot(211)
X, y = make_moons(n_samples=200, random_state=123,noise=0.02)
plt.title("noise=0.02")
plt.scatter(X[:, 0], X[:, 1], c=y)  
plt.subplot(212)
X1, y1 = make_moons(n_samples=200, random_state=123,noise=0.1)
plt.title("noise=0.1")
plt.scatter(X1[:, 0], X1[:, 1], c=y1)
<matplotlib.collections.PathCollection at 0x23da1626670>

在这里插入图片描述

二:圆环数据–make_circles()

sklearn.datasets.make_circles(n_samples=100, shuffle=True, noise=None, random_state=None, factor=0.8)

重要参数:n_samples:设置样本数量、noise:设置噪声、factor:0 < double < 1 默认值0.8,内外圆之间的比例因子、random_state:设置随机参数(嘿嘿,无所谓,随便设),我们主要讲参数noise、factor

#导入必要库
from sklearn.datasets import  make_circles
import numpy as np
from numpy import where
import matplotlib.pyplot as plt
X, yy = make_circles(n_samples=200, random_state=123,
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值