array中不同值的数量 python_用Python将一个文件夹中的文件分别拷贝到不同文件中...

本文介绍了一位人工智能算法标注工程师如何利用Python的shutil库和JSON解析,将垃圾分类识别比赛的数据按类别整理到不同的文件夹中。通过读取文件夹中的txt标签和JSON映射文件,对图片进行移动并创建相应的分类文件夹,便于查看和分析。
摘要由CSDN通过智能技术生成

最近华为云发布了垃圾分类识别的比赛,就注册账号,想看看。从官网上下载了数据,发现图片和txt文档是放在一个文件夹里的。其中命名对应的txt中是标明了该图片的垃圾分类ID

1a2c8614e28ddb3c4611989435e7ddfd.png

aa25ab529dba9809e470f3575007d416.png

但其实在分析数据的过程中,我希望查看一下每个分类下面的图片的情况,所以希望按照将同一个分类的图片能放在同一个文件夹中,以方便查看。 这时候,就用了到了shutil库

同时,因为类目ID和垃圾分类类目的关系存储在了另外的一个JSON文件中,也需要将其读取进来,然后根据映射情况来命名文件夹

9bffb77e552834e6a3414523c10fc1ca.png

具体的代码和详细备注如下:

#coding:utf-8
import os
import json
import shutil
import re

#读取下载的文件
f_list = os.listdir('下载的文件地址路径')

#将类目ID同分类映射的JSON文件读进来
with open('JSON文件地址路径', encoding='utf-8') as f:
    rules = json.loads(f.read())
    f.close()

#开始来拷贝文件了
for file in f_list:
    #由于文件夹中有txt文件和jpeg两种格式,需要进行处理,读取txt格式文件
    if os.path.splitext(file)[1]  == '.txt':
        imgID =file.replace('.txt','')
        f=open('下载的文件地址路径'+'/'+file,'r+').readlines()
        file_name,cateID=f[0].split(',')
        #小细节处理,因为上一步对文件处理提取cateID是,得到的格式是‘  1’而不是‘1’,故需要处理一下用re库的replace删除
        fold_name=rules[cateID.replace(' ','')]
        #另一处小细节处理,看上图可以看到数据中的命名为'可回收垃圾/旧衣服',这样在Python路径中作为文件名会导致多一层文件,故改成了’可回收垃圾_旧衣服‘
        fold_name=fold_name.replace('/','_')
        #设置最后要拷贝的文件名称
        determination = '文件夹路径名'+fold_name+'/'
        #判断文件夹是否存在
        if not os.path.exists(determination):
            os.makedirs(determination)
        #从一个文件中往另外一个文件夹移动文件
        shutil.copyfile('下载的文件地址路'+file_name, determination+file_name)
print('Done')

最后可以看到拷贝移动完后的结果如下图:

963771406b5910ec27ee95cba039b69c.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值