python根据label.txt将未分类的图片数据集分类，一个文件夹为一个单独的类别

不要影响我叠Q

于 2020-12-12 08:21:02 发布

阅读量821

点赞数

分类专栏： python学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15054345/article/details/111056541

版权

python学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

代码如下，改下train_data的路径即可


import numpy as np
import os
import shutil


def read_txt(full_path: str) -> dict:
    m = {}
    i = 0
    for line in open(full_path).readlines():
        i += 1
        tmp = line[:-1]
        # label = np.append(label, tmp)
        file_name = str(i) + '.jpg'
        m[file_name] = tmp
    return m


# 根据label.txt处理数据集，对每一个类别建立一个文件夹
def deal_train(path):
    file_names = np.array([])
    label_dict = {}
    for _, _, files in os.walk(path):
        for file in files:
            if os.path.splitext(file)[1] == '.txt':
                full_path = os.path.join(os.getcwd(), path[2:], file)
                label_dict = read_txt(full_path)
                break

        for file in files:
            if os.path.splitext(file)[1] == '.jpg':
                # file_names = np.append(file_names, file)
                category = label_dict[file]
                if category == '1' or category == '-1':
                    full_path = os.path.join(os.getcwd(), path[2:], category)
                    if not os.path.exists(full_path):
                        os.mkdir(full_path)
                    # 将当前文件拷贝到新建的目录下
                    if not os.path.exists(os.path.join(full_path, file)):  # 判断目标文件夹不存在该文件才进行拷贝
                        shutil.copy(os.path.join(os.getcwd(), path[2:], file), os.path.join(full_path, file))


train_path = './data/train'
validate_path = './data/validate'

if __name__ == '__main__':
    # deal_train(train_path)
    deal_train(validate_path)

不要影响我叠Q

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
python根据label.txt将未分类的图片数据集分类，一个文件夹为一个单独的类别

代码如下，改下train_data的路径即可import numpy as npimport osimport shutildef read_txt(full_path: str) -> dict: m = {} i = 0 for line in open(full_path).readlines(): i += 1 tmp = line[:-1] # label = np.append(label, tmp)
复制链接

扫一扫

专栏目录

不要影响我叠Q CSDN认证博客专家 CSDN认证企业博客

码龄10年

200: 原创

4万+: 周排名

6358: 总排名

45万+: 访问

: 等级

4976: 积分

328: 粉丝

658: 获赞

98: 评论

1157: 收藏

私信

关注

分类专栏

最新评论

wsl中的ubuntu安装docker踩坑记
新手小白12138--: 您好我service docker status显示running, 但是 service --statues-all 又显示没开启，运行hello world也显示未启动 ddocker daemon，请问您知道这是什么原因吗？ log如下： [code=python] (glip) root@fdb7e138bfe8:~/data3/zhengby/YOLO-World-master# service docker start && service docker status * Starting Docker: docker [ OK ] * Docker is running (glip) root@fdb7e138bfe8:~/data3/zhengby/YOLO-World-master# service --status-all [ - ] apparmor [ - ] cron [ - ] dbus [ - ] docker [/code]
《intel开发手册卷3》读书笔记1
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
3D Slicer导入标签与查看标签
咿喃小记: 请问可以批量这样导出吗？
3D Slicer将分割结果保存
咿喃小记: 请问3d slicer可以批量这样导出吗？
ITK-SNAP截图时关闭十字定位线
纵横君=_=: 太太太牛了！！！！

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。