数据集划分 - 训练集、测试集、验证集

最新推荐文章于 2024-08-12 23:14:25 发布

Banbakaban

最新推荐文章于 2024-08-12 23:14:25 发布

阅读量1.8k

点赞数

分类专栏：格式转换文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Banbakaban/article/details/122339447

版权

格式转换专栏收录该内容

6 篇文章 0 订阅

订阅专栏

数据集划分是炼丹的准备工作。附上一次性划分的步骤。

Step1: 获取所有文件名

ls >a.txt

注意在生成的txt里将其本名删去。
在这里插入图片描述

Step2：按照比例划分
这里使用的是train:test:val = 7:2:1 的比例划分。直接用mod10结果分类。

# clear contents
with open('val.txt', 'a+', encoding='utf-8') as f_val:
    f_val.truncate(0)
f_val.close()

with open('test.txt', 'a+', encoding='utf-8') as f_test:
    f_test.truncate(0)
f_test.close()

with open('train.txt', 'a+', encoding='utf-8') as f_train:
    f_train.truncate(0)
f_train.close()

# read and write
with open("a.txt", encoding='utf-8') as f:
    count = 0
    for line in f.readlines():
        count = count + 1
        # print("NO.", count, ":", line)
        if count % 10 == 1:
            with open('val.txt', 'a') as f_val:
                f_val.write(line)
            f_val.close()
        elif count % 5 == 0:
            with open('test.txt', 'a') as f_test:
                f_test.write(line)
            f_test.close()
        else:
            with open('train.txt', 'a') as f_train:
                f_train.write(line)
            f_train.close()
f.close()

结果：

在这里插入图片描述

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Banbakaban CSDN认证博客专家 CSDN认证企业博客

码龄5年

20: 原创

28万+: 周排名

150万+: 总排名

2万+: 访问

: 等级

277: 积分

2: 粉丝

11: 获赞

4: 评论

86: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据集划分 - 训练集、测试集、验证集
东环路的小爱凌: 请问如果是对一份表格数据文件进行降维，那应该是分不同行样本划分训练集验证集和测试集吗？
[学习笔记]seaborn 函数学习
小白炼丹师: 好的谢谢，发现直接plt.xlim()扩大x轴更方便
[学习笔记]seaborn 函数学习
Banbakaban 回复小白炼丹师: 前面加一行控制画布的语句，如下例 sns.FacetGrid(tips,height=5,aspect=1.5,xlim=[0,70])
[学习笔记]seaborn 函数学习
小白炼丹师: 您好，请问case1中图例把散点遮住了，怎么解决？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。