人脸表情识别：RAF_DB数据集预处理

hybin15

已于 2024-03-26 18:46:09 修改

阅读量3k

点赞数 17

文章标签：数据库 python 深度学习

于 2024-03-26 15:47:19 首次发布

本文链接：https://blog.csdn.net/hybin15/article/details/137047712

版权

RAF_DB数据集下载：RAF-DB_数据集-飞桨AI Studio星河社区 (baidu.com)

basic:单一表情——7种

compound：复合表情——11种

两者均给出了初始数据集和人脸对齐后的数据集；

数据集到手存在train和test未分开的情况，且每种表情并未分类按文件夹存放。官方给出了每张图片对应的表情txt文件；

设计代码实现数据集的train和test的分类，并按图片标签进一步分类存放图片，以basic original文件夹下的数据集为例，其他同理，代码如下（建议在 Jupyter Notebook 逐块运行）：

import os,shutil
#将txt转换成list，按组存放
listfile = open('RAF_basic/list_patition_label.txt', 'r') #你list_patition_label对应位置
js = listfile.read()
list1 = js.split()
result = []
for i in range(0,len(list1)-1,2):
    result.append(list1[i:i+2])
#     print(result)
listfile.close()

#将train和test数据集分到两个文件夹下
files_list = os.listdir('RAF_basic/original/')#以original为例

initial=os.getcwd()#获取当前所在文件夹位置
workpath=os.path.join(initial,'RAF_basic')
datapath=os.path.join(workpath,'original')#有点冗余，嫌麻烦就没改了
for file in files_list:
    datatype = file.split('_')[0]#对图片文件名进行分割，取test/train
    os.chdir(datapath)#进入目标文件夹
    if not os.path.exists(datatype):
        os.mkdir(datatype)
    shutil.move(file,datatype)#移动，注意移动时必须在目标文件夹下
            
os.chdir(initial)#回到初始文件夹下，如果不回在jupyter notebook下重复运行可能报错

修改记录：对于aligned人脸对齐数据集中图片名称多出aligned问题，做出改进，删除aligned部分再进行匹配。

#分别将test和train文件夹下的图片按txt中的标签进行分类存放
test_list = os.listdir('RAF_basic/original/test/')
train_list = os.listdir('RAF_basic/original/train/')
#对test进行分类
for file in test_list:
    for j in range(len(result)):

#aligned用     
#         file_m=str(file.split('_')[0])+'_'+str(file.split('_')[1])+'.jpg'
#         if file_m == result[j][0]:#文件名与txt中匹配
#original用
        if file == result[j][0]:#文件名与txt中匹配
        
            os.chdir(os.path.join(datapath,'test'))#进入指定文件夹
            if not os.path.exists(result[j][1]):
                os.mkdir(result[j][1])#没有文件夹就创建
            shutil.move(file,result[j][1])#移动
#对train进行分类
for file in train_list:
    for j in range(len(result)):

#aligned用   
#         file_m=str(file.split('_')[0])+'_'+str(file.split('_')[1])+'.jpg'
#         if file == result[j][0]:

#original用
        if file == result[j][0]:

            os.chdir(os.path.join(datapath,'train'))
            if not os.path.exists(result[j][1]):
                os.mkdir(result[j][1])
            shutil.move(file,result[j][1])
os.chdir(initial)