打乱sklearn鸢尾花数据集的方法

最新推荐文章于 2023-09-29 19:29:12 发布

okksss

最新推荐文章于 2023-09-29 19:29:12 发布

阅读量755

点赞数

文章标签： sklearn 机器学习 python

本文链接：https://blog.csdn.net/okksss/article/details/127396055

版权

打乱sklearn鸢尾花数据集的方法

在分类鸢尾花数据集的时候发现数据是按类别排列的，因此想打乱数据集便于训练数据和测试数据的分割。鸢尾花数据集中的数据是按字典存放的，需要打乱字典并且保留样本和标签的对应关系。本想在网上搜索简便方法，但是暂时没有找到，于是自己写了一个不算简便的方法，希望看到这篇文章的小伙伴如果有简便方法可以告知我一下

1. 导入数据，查看原始数据格式

from sklearn import datasets
import random
from sklearn.model_selection import train_test_split


#查看数据
iris = datasets.load_iris()
print(iris)

在这里插入图片描述
鸢尾花数据以字典的形式存放，样本包含四个特征： - sepal length （cm） - sepal width （cm） - petal length （cm） - petal width （cm），三个类别： - Iris-Setosa - Iris-Versicolour - Iris-Virginica
2. 打乱数据

x = iris['data']
y = iris['target']
#打乱鸢尾花数据集
id = [i for i in range(0,len(x))]
random.shuffle(id)
x_copy = x.copy()
y_copy = y.copy()
for j in range(0,len(x)):
    x[j] = x_copy[id[j]]
    y[j] = y_copy[id[j]]
#print(x,y)

3. 分割数据集

x_train,x_test,y_train,y_test = train_test_split(x,y,train_size=0.7)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

okksss

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
打乱sklearn鸢尾花数据集的方法

打乱鸢尾花数据集
复制链接

扫一扫

在Keras中利用np.random.shuffle()打乱数据集实例

09-16

主要介绍了在Keras中利用np.random.shuffle()打乱数据集实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

sklearn打乱数据顺序

沃·夏澈德的博客

07-15

1289

import sklearn import numpy as np X = np.array([[1, 2], [3, 4], [5, 6]]) Y = np.array([[1], [2], [3]]) print(X) print(Y) ''' [[1 2] [3 4] [5 6]] [[1] [2] [3]] '''

2 条评论您还未登录，请先登录后发表或查看评论

卜若的代码笔记-sklearn-第二章：knn（2）-对训练集进行打乱处理

qq_37080133的博客

06-09

367

1.对数据集打乱是个很重要的课题，在sklearn里面提供了置乱的函数，我这里提供一个简单的例子： import numpy as np from sklearn.utils import shuffle data = np.array([['王大'], ['王二'], ['王三'], ['王四'],['王五'],['王六'],['王七'],['王八'],['王九'],['王十']]) label = np.array([1, 2, 3, 4,5,6,7,8,9,10]) data,label =.

打乱训练数据的方法

LittleSunlight的博客

09-19

937

打乱数据的方法

Python打乱数据集

qq_47104322的博客

05-06

554

打乱并划分数据集

用 sklearn.utils.shuffle 来打乱样本顺序

cocofisher的博客

04-16

8004

直接举例说明： import sklearn X = np.array([[1, 2], [3, 4], [5, 6]]) Y = np.array([[1], [2], [3]]) print(X) print(Y) [[1 2] [3 4] [5 6]] [[1] [2] [3]] x, y = sklearn.utils.shuffle(X, Y) print(x) print(...

机器学习KNN实践—鸢尾花分类（基于sklearn库）

04-27

(1)使用SCIKIT-LEARN的自带的鸢尾花数据集，获取数据集的后两个特征，形成原始数据集D。 (2)待决策样本集D1的产生：在原始二维特征空间，基于该数据集的两种特征取值的最小值、最大值，获取该数据集的矩形包围盒，并...

shufflenet V1和V2 基于花数据集的分类

04-02

在基于花数据集的分类任务中，ShuffleNet V1可以很好地适应小型数据集的特点，通过迁移学习策略，如预训练模型的微调，快速适应新的分类任务。花数据集通常包含多种花卉类别，对于图像识别来说具有挑战性，因为不同...

二维空间基于Cart分类树的鸢尾花分类（基于sklearn库）

04-27

使用SCIKIT-LEARN的自带的鸢尾花数据集，获取该数据集150个样本的后两个特征及相应类别标签。 2.数据集的最小包围盒的获取，以及数据集的划分。 (1)获取原始二维空间中150个样本的最小包围矩形[x1_min, x1_max]*[x2...

20newsgroup数据集-机器学习-标准数据集（all）下载方式 from sklearn.datasets import fetch_20newsgrou

09-25

在Python的机器学习库scikit-learn（sklearn）中，我们可以方便地通过`fetch_20newsgroups`函数来下载和加载这个数据集。这个函数提供了对数据集进行预处理的选项，例如去除标点符号、数字和停用词，这在文本分析中...

Oxford flowers17数据集，已打乱并划分训练集、验证集、测试集

09-02

文章《Keras 入门课6 -- 使用Inception V3模型进行迁移学习》https://blog.csdn.net/tsyccnh/article/details/78889838 使用的数据集

数据集打乱排序

GY-赵的博客

11-29

483

#处理图片 trainImg_file = os.listdir(trainImg_path) testImg_file = os.listdir(testImg_path) data1,data2=[],[] for i in trainImg_file: #print(i) file = os.path.join(trainImg_path, i) img = Image.open(file) img = img.crop((25, 25, 225, 225))

数据预处理之打乱数据集

sheqianweilong的博客

01-29

1694

import numpy as np from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets('data/',one_hot=True) train_imgs = mnist.train.images train_labels = mnist.train.labels test_imgs = mnist.test.images test_label_imgs = mnist.te

数据集处理（三）——打乱数据集

weixin_47954807的博客

03-18

1909

1 个目录问题描述解决思路完整代码二级目录三级目录问题描述目前已有的数据集包括网上已有的数据集和线下拍摄的数据集，需要进行汇总。同时，为了加强模型的泛化能力，需要打乱数据集。解决思路已有的数据集包括42088个文件 resultList = [] # 用于存放结果的List A = 50000000 # 最小随机数 B = 50042088 # 最大随机数 COUNT = 42088 # 利用Python中的randomw.sample()函数实现 resultList = random.sa

python中中将数据集打乱_在Keras中利用np.random.shuffle()打乱数据集实例

weixin_42099151的博客

12-23

2185

我就废话不多说了，大家还是直接看代码吧~?补充知识：Keras中shuffle和validation_split的顺序模型的fit函数有两个参数，shuffle用于将数据打乱，validation_split用于在没有提供验证集的时候，按一定比例从训练集中取出一部分作为验证集这里有个陷阱是，程序是先执行validation_split，再执行shuffle的，所以会出现这种情况：假如你的训练集是有...

数据集及对应标签的打乱

weixin_45151405的博客

02-12

606

数据集及其对应标签打乱

数据集乱序的几种方法

nyz5211314的博客

10-26

2950

random.shuffle和numpy.random.shuffle的区别 random.shuffle只能对一维list和两维list进行数据打乱 numpy.random.shuffle可以对列表和数组进行数据打乱 1. 使用索引值 from random import shuffle x_train, y_train = load_data() # 创建索引 index = [i for i in range(len(x_train))] # 打乱索引 shuffle(index) # 获得打乱的

常用数据打乱方法总结

xf1234的博客

11-28

2284

数据打乱方法1.标注文件说明2.读取标注文件1.排序打乱2.切片打乱3. 当我们拿到一个数据集后，我们需要先从标注文件中读取数据，然后对其进行打乱（shuffle），我们那celeba数据集为例进行说明 1.标注文件说明 202599 image_id x_1 y_1 width height 000001.jpg 95 71 226 313 000002.jpg 72 94 221 306 000003.jpg 216 59 91 126 000004.jpg 622 257

机器学习中打乱数据集有什么作用

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交