RAF_DB数据集下载:RAF-DB_数据集-飞桨AI Studio星河社区 (baidu.com)
basic:单一表情——7种
compound:复合表情——11种
两者均给出了初始数据集和人脸对齐后的数据集;
数据集到手存在train和test未分开的情况,且每种表情并未分类按文件夹存放。官方给出了每张图片对应的表情txt文件;
设计代码实现数据集的train和test的分类,并按图片标签进一步分类存放图片,以basic original文件夹下的数据集为例,其他同理,代码如下(建议在 Jupyter Notebook 逐块运行):
import os,shutil
#将txt转换成list,按组存放
listfile = open('RAF_basic/list_patition_label.txt', 'r') #你list_patition_label对应位置
js = listfile.read()
list1 = js.split()
result = []
for i in range(0,len(list1)-1,2):
result.append(list1[i:i+2])
# print(result)
listfile.close()
#将train和test数据集分到两个文件夹下
files_list = os.listdir('RAF_basic/original/')#以original为例
initial=os.getcwd()#获取当前所在文件夹位置
workpath=os.path.join(initial,'RAF_basic')
datapath=os.path.join(workpath,'original')#有点冗余,嫌麻烦就没改了
for file in files_list:
datatype = file.split('_')[0]#对图片文件名进行分割,取test/train
os.chdir(datapath)#进入目标文件夹
if not os.path.exists(datatype):
os.mkdir(datatype)
shutil.move(file,datatype)#移动,注意移动时必须在目标文件夹下
os.chdir(initial)#回到初始文件夹下,如果不回在jupyter notebook下重复运行可能报错
修改记录:对于aligned人脸对齐数据集中图片名称多出aligned问题,做出改进,删除aligned部分再进行匹配。
#分别将test和train文件夹下的图片按txt中的标签进行分类存放
test_list = os.listdir('RAF_basic/original/test/')
train_list = os.listdir('RAF_basic/original/train/')
#对test进行分类
for file in test_list:
for j in range(len(result)):
#aligned用
# file_m=str(file.split('_')[0])+'_'+str(file.split('_')[1])+'.jpg'
# if file_m == result[j][0]:#文件名与txt中匹配
#original用
if file == result[j][0]:#文件名与txt中匹配
os.chdir(os.path.join(datapath,'test'))#进入指定文件夹
if not os.path.exists(result[j][1]):
os.mkdir(result[j][1])#没有文件夹就创建
shutil.move(file,result[j][1])#移动
#对train进行分类
for file in train_list:
for j in range(len(result)):
#aligned用
# file_m=str(file.split('_')[0])+'_'+str(file.split('_')[1])+'.jpg'
# if file == result[j][0]:
#original用
if file == result[j][0]:
os.chdir(os.path.join(datapath,'train'))
if not os.path.exists(result[j][1]):
os.mkdir(result[j][1])
shutil.move(file,result[j][1])
os.chdir(initial)