Python 随机抽取文件进行移动（用于从训练集抽取测试集）

最新推荐文章于 2023-03-06 21:54:00 发布

Xiuxiu_Law

最新推荐文章于 2023-03-06 21:54:00 发布

阅读量1.2k

点赞数 2

文章标签： python

本文链接：https://blog.csdn.net/Xiuxiu_Law/article/details/107717039

版权

一般情况下，在用数据集对神经网络进行训练之前我们要将其10等分，其中9份用于训练，1份用于测试，我们就可以进行随机抽取。

字符串的相关操作

以 f 或 F 开头的字符串，以 {} 包含的部分可以进行值替换。例如：

dst = "D:/out/some"
label = 3
dstpath = f"{dst}/{label}"
print(dstpath)
>>>D:/out/some/3

在字符串前加r可防止字符串转义，或者在反斜杠前加反斜杠，再或者使用正斜杠替代反斜杠也可。例如：

root = glob.glob("D:\out\some\cag\\3")
root = glob.glob(r"D:\out\some\cag\3")
root = glob.glob("D:/out/some/cag/3")

完整代码：

import os, random, shutil ,glob, tqdm

root = glob.glob(r"origin_root/*")
dst = "target_root"

for imgdirs in root:
    imgdirs = imgdirs.replace("\\", "/")
    files = os.listdir(imgdirs)
    filenum = len(files)
    label = imgdirs.split("/")[-1]
    filesample = random.sample(files, filenum//10)  # 随机从每个类别文件夹中选取1/10的图片

    for filename in tqdm.tqdm(filesample):
        dstpath = f"{dst}/{label}"
        if not os.path.exists(dstpath):
            os.makedirs(dstpath)
        shutil.move(f"{imgdirs}/{filename}", f"{dstpath}/{filename}")

其中origin_root表示图片类别文件夹所在的路径，/*表示origin_root下所有的文件夹，root就是这些文件夹路径的列表，通过os.listdir()我们找到文件夹下的图片，随机抽取总数的1/10。target_root为目标路径。tqdm可以加上进度条。label为不同图片的标签，即类别。

Xiuxiu_Law

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Python 随机抽取文件进行移动（用于从训练集抽取测试集）

一般情况下，在用数据集进行训练之前我们要将其10等分，其中9份用于训练，1份用于测试，我们就可以进行随机抽取。以f或F开头的字符串，以{}包含的部分可以进行值替换。例如：dst = "D:/out/some"label = 3dstpath = f"{dst}/{label}"print(dstpath)>>>D:/out/some/3在字符串前加r可防止字符串转义，或者在反斜杠前加反斜杠，再或者使用正斜杠替代反斜杠也可。例如：root = glob...
复制链接

扫一扫