今天把从网上申请的数据集下载了下来,里面大概50多G的图片 还有一个分好类的csv
因此我想通过csv中的类别把图片分离出来(cav中记录了图片路径 图片类别)
其中涉及到了csv的读取 运用到pandas库 dataframe转list 运用到了numpy库 还有shutil模块!
代码如下:
import pandas as pd import shutil import os import numpy as np c=pd.read_csv("training.csv") for i in range(0,11): if not os.path.exists('d:/'+str(i)): os.makedirs('d:/'+str(i)) data=np.array( c[c.expression==(i)][[ 'subDirectory_filePath']]) l=data.tolist() for x in l: shutil.copy('D:/Manually_Annotated_Images/'+str(x[0]),'d:/'+str(i))