随机切分csv训练集和测试集鸢尾花

最新推荐文章于 2024-01-03 12:31:29 发布

吃猫包的鱼

最新推荐文章于 2024-01-03 12:31:29 发布

阅读量617

点赞数 1

文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68682144/article/details/127971655

版权

import csv
import os
import numpy as np
'''将iris.csv中的数据分成train_iris和test_iris两个csv文件，其中train_iris.csv中有120个数据，test_iris.csv中有30个数据'''

labels = []
data = []
a_train_file = 'train_iris.csv'
a_test_file = 'test_iris.csv'
a_file = 'iris.csv'
seed = 3 
np.random.seed(seed) #seed() 方法改变随机数生成器的种子，每次运行随机函数生成的结果都一样
train_indices = np.random.choice(150, 120, replace=False) # 设置随机数生成从0-150中随机挑选120个随机数
residue = np.array(list(set(range(150)) - set(train_indices)))
test_indices = np.random.choice(len(residue),30, replace=False) # 如果训练集和测试集综合的数据加起来就是一整个数据集则不需要这个操作
with open(a_file)as afile:
    a_reader = csv.reader(afile)  #从原始数据集中将所有数据读取出来并保存到a_reader中
    labels = next(a_reader)  # 提取第一行设置为labels
    for row in a_reader:  # 将a_reader中每一行的数据提取出来并保存到data的列表中
        data.append(row)
# 生成训练数据集
if not os.path.exists(a_train_file):
    with open(a_train_file, "w", newline='') as a_trian:
        writer = csv.writer(a_trian)
        writer.writerows([labels])  #第一行为标签行
        writer.writerows(np.array(data)[train_indices])
        a_trian.close()
# 生成测试数据集
if not os.path.exists(a_test_file):
    with open(a_test_file, "w", newline='')as a_test:
        writer = csv.writer(a_test)
        writer.writerows([labels])  #第一行为标签行
        writer.writerows(np.array(data)[test_indices])
        a_test.close()

吃猫包的鱼

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
随机切分csv训练集和测试集鸢尾花

鸢尾花数据拆分 python
复制链接

扫一扫

吃猫包的鱼 CSDN认证博客专家 CSDN认证企业博客

码龄2年

31: 原创

52万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

647: 积分

246: 粉丝

336: 获赞

15: 评论

268: 收藏

私信

关注

热门文章

最新评论

python小tips
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
软件测试----5天前置基础知识day2（黑马）
普通网友: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
Amazon（亚马逊）数据集
CSDN-Ada助手: “恭喜您发布了关于亚马逊数据集的博客，您的持续创作值得称赞！希望您可以继续分享关于亚马逊数据集的更多信息，或者可以探讨一些与数据集相关的实际应用案例，这将会为读者带来更多的启发和帮助。期待您的下一篇博客！”
④linux之系统管理
CSDN-Ada助手: 恭喜用户在博客中分享了关于Linux系统管理的内容，持续创作是非常值得鼓励的。希望用户在下一篇博客中可以继续深入探讨Linux系统管理的相关知识，可以尝试结合实际案例或者分享自己的经验，让读者更加深入地了解这方面的内容。期待用户更多精彩的创作！祝愿用户越来越好！
⑤linux---常用基本命令之文件目录类
CSDN-Ada助手: 恭喜您写了第16篇博客，内容涵盖了Linux常用基本命令，对于初学者来说非常实用。希望您能继续保持创作的热情，不断分享更多有价值的知识和经验。下一步可以考虑深入探讨一些高级命令或者与Linux相关的实际应用场景，这样可以让读者更全面地了解Linux系统。期待您更多的精彩内容！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。