python已有整个数据集和验证集，自动生成训练集

鸡丝米线

已于 2022-04-06 18:00:50 修改

阅读量1.5k

点赞数

分类专栏： python 文章标签： python

于 2022-04-06 17:47:44 首次发布

本文链接：https://blog.csdn.net/qq_43659401/article/details/123995651

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

说明：txt文件中保存的是数据集索引，每个索引用\n隔开，内容是str形式如果txt文件中存放的内容形式是字典，请看博主的另一篇博客

import random
import numpy as np
import re
import sys
import os
'''
自定义验证集，大家可按照自己想要的方式生成验证集，已有验证集的这步跳过
'''
#随机挑选200张图片作为验证集和1229张图片作为训练集
resultlist = random.sample(range(1, 1449),200)
print(resultlist)
#随机生成两百张验证集的索引
np.savetxt('val.txt', resultlist, fmt="%d", delimiter="\n")
#把剩下的图片作为训练集并生成索引
'''
利用已有验证集生成训练集
'''
str1 = []
str2 = []
str_dump = []
fa = open("val.txt", 'r')
fb = open("data.txt", 'r')#填路径
fc = open("train.txt", 'w+')

# 将A.txt的内容逐行读到str1中
for line in fa.readlines():
    str1.append(line.replace("\n", ''))  #line.replace("\n",'') 去掉换行符\n
# 将B.txt中的内容逐行读到str2中
for line in fb.readlines():
    str2.append(line.replace("\n", ''))

# 将两个文件中重复的行，添加到str_dump中
for i in str1:
    if i in str2:
        str_dump.append(i)

# 将两个文件的行合并，并去重
str_all = set(str1 + str2)

# 将重复的行，在去重的合并行中，remove掉，剩下的就是不重复的行了
for i in str_dump:
    if i in str_all:
        str_all.remove(i)
# 写到文件中
for i in list(str_all):
    fc.write(i + '\n')

fa.close()
fb.close()
fc.close()

整理不易，如果觉得还不错，收藏和点赞哦！有错误请指正！谢谢家人们！

鸡丝米线

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python已有整个数据集和验证集，自动生成训练集

说明：txt文件中保存的是数据集索引，每个索引用\n隔开，内容是str形式如果txt文件中存放的内容形式是字典，请看博主的另一篇博客import randomimport numpy as npimport reimport sysimport os'''自定义验证集，大家可按照自己想要的方式生成验证集，已有验证集的这步跳过'''#随机挑选200张图片作为验证集和1229张图片作为训练集resultlist = random.sample(range(1, 1449),200)pri
复制链接

扫一扫