matlab 训练集随机取样,随机切分csv训练集和测试集

最新推荐文章于 2023-02-28 13:28:47 发布

周孙策

最新推荐文章于 2023-02-28 13:28:47 发布

阅读量1k

点赞数

文章标签： matlab 训练集随机取样

使用numpy切分训练集和测试集

觉得有用的话,欢迎一起讨论相互学习~Follow Me

序言

在机器学习的任务中，时常需要将一个完整的数据集切分为训练集和测试集。此处我们使用numpy完成这个任务。 iris数据集中有150条数据，我们将120条数据整合为训练集，将30条数据整合为测试集。

程序

import csv

import os

import numpy as np

'''将iris.csv中的数据分成train_iris和test_iris两个csv文件，其中train_iris.csv中有120个数据，test_iris.csv中有30个数据'''

labels = []

data = []

a_train_file = 'train_iris.csv'

a_test_file = 'test_iris.csv'

a_file = 'iris.csv'

seed = 3

np.random.seed(seed)

train_indices = np.random.choice(150, 120, replace=False) # 设置随机数生成从0-150中随机挑选120个随机数

residue = np.array(list(set(range(150)) - set(train_indices)))

test_indices = np.random.choice(len(residue),30, replace=False) # 如果训练集和测试集综合的数据加起来就是一整个数据集则不需要这个操作

with open(a_file)as afile:

a_reader = csv.reader(afile) #从原始数据集中将所有数据读取出来并保存到a_reader中

labels = next(a_reader) # 提取第一行设置为labels

for row in a_reader: # 将a_reader中每一行的数据提取出来并保存到data的列表中

data.append(row)

# 生成训练数据集

if not os.path.exists(a_train_file):

with open(a_train_file, "w", newline='') as a_trian:

writer = csv.writer(a_trian)

writer.writerows([labels]) #第一行为标签行

writer.writerows(np.array(data)[train_indices])

a_trian.close()

# 生成测试数据集

if not os.path.exists(a_test_file):

with open(a_test_file, "w", newline='')as a_test:

writer = csv.writer(a_test)

writer.writerows([labels]) #第一行为标签行

writer.writerows(np.array(data)[test_indices])

a_test.close()

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
matlab 训练集随机取样,随机切分csv训练集和测试集

使用numpy切分训练集和测试集觉得有用的话,欢迎一起讨论相互学习~Follow Me序言在机器学习的任务中，时常需要将一个完整的数据集切分为训练集和测试集。此处我们使用numpy完成这个任务。 iris数据集中有150条数据，我们将120条数据整合为训练集，将30条数据整合为测试集。程序import csvimport osimport numpy as np'''将iris.csv中的数据分成...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。