背景:有一堆已经带有标记的图片,如图1所示。图片标记是以.csv格式存储,如图2。
(图1)
(图2)
然后把两类图片根据csv中标记不同,分成两个文件夹。带有标记的文件为:classifation_path.csv 初始文件夹为:old_flie,分后的文件夹分别为:new_file_0;new_file_1.代码如下。
import pandas as pd
import numpy as np
import os
import shutil
def classifation(file_path,classifation_path):
#获取所有图片名称
c = []
names = os.listdir(file_path) #路径
for name in names:
index = name.rfind('.')
name = name[:index]
c.append(name)
# 获取csv中图片所述类别
df = pd.read_csv(classifation_path) #已经是dataframe格式了
for files in c :
# 条件判断提取类别
id = df.loc[df['name'] == files,'id'].values[0] #将name=files的对应的id提取出来
# id = df.get_value(df.loc[df['name'] == files].index.values[0], 'id') #作用同上
# print(id)
picture_path = "C:\\Users\\happy\\Desktop\\old_file\\"+files+".jpg"
#图片分类
if id == 0 :
shutil.move(picture_path,"C:\\Users\\happy\\Desktop\\new_file_0")
else :
shutil.move(picture_path,"C:\\Users\\happy\\Desktop\\new_file_1")
print('all is moved')
classifation('C:\\Users\\happy\\Desktop\\old_file','C:\\Users\\happy\\Desktop\\classifation_path.csv')
因为作者是张艺兴的小迷妹,就用了张艺兴和孙红雷的图片做实验。
分之前:
分之后:
注意:可能出现一个问题就是,在old_file中可能出现thumbs.db这个东西,产生一个bug,看某度找一下解决办法就好啦。