动手学深度学习——6. FairFace多标签分类

最新推荐文章于 2025-03-31 15:20:32 发布

QWERDF007

最新推荐文章于 2025-03-31 15:20:32 发布

阅读量2.3k

点赞数 2

分类专栏：动手学深度学习文章标签：深度学习 pytorch 多标签分类

本文链接：https://blog.csdn.net/LEO_Angel01/article/details/116103164

版权

动手学深度学习专栏收录该内容

8 篇文章

订阅专栏

该博客介绍了如何利用FairFace数据集训练一个人脸的多标签分类器，包括年龄、性别和种族分类。通过使用PyTorch的DataParallel(DDP)进行并行训练，提升了训练效率。博主详细展示了数据预处理，如使用LabelEncoder和OneHotEncoder编码标签，以及训练过程和验证结果。最后，还提供了预测代码用于检查模型性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

动手学深度学习——6. FairFace多标签分类

记录一下学习深度学习的一些。本篇简述使用 fairface 训练一个关于人脸的多标签分类器，并且使用 pytorch 的 DDP 加速训练。

环境：

ubuntu 16.04
2080Ti * 6
Pytorch 1.2.0

数据准备

FairFace 是这篇 paper 所提供的一个数据集，包含 7 个种族，9 个年龄段及性别。

age_labels = ['0-2', '10-19', '20-29', '3-9', '30-39', '40-49', '50-59', '60-69', 'more than 70']
gender_labels = ['Female', 'Male']
race_labels = ['Black', 'East Asian', 'Indian', 'Latino_Hispanic', 'Middle Eastern', 'Southeast Asian', 'White']

下载地址：

Github
百度网盘：v1xn

预览

margin025：

margin125：

编码标签

官方提供的标签文件并不能直接用来训练，需要编码为分类数据才能使用。training labels 前10条

file,age,gender,race,service_test
train/1.jpg,50-59,Male,East Asian,True
train/2.jpg,30-39,Female,Indian,False
train/3.jpg,3-9,Female,Black,False
train/4.jpg,20-29,Female,Indian,True
train/5.jpg,20-29,Female,Indian,True
train/6.jpg,20-29,Male,White,True
train/7.jpg,40-49,Male,Middle Eastern,False
train/8.jpg,30-39,Female,Indian,True
train/9.jpg,10-19,Male,White,True
train/10.jpg,30-39,Male,Middle Eastern,False

这里使用 sklearn 提供的 LabelEncoder，OneHotEncoder 来进行编码

import argparse
import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder

if __name__ == '__main__':
    parser = argparse.ArgumentParser(formatter_class=argparse.ArgumentDefaultsHelpFormatter)
    parser.add_argument('--csv', type=str, help='path to annotation file')
    parser.add_argument('--output', type=str, help='path to output file')
    args = parser.parse_args()
    df_res = pd.DataFrame()
    df = pd.read_csv(args.csv)
    df_res['file'] = df['file']
    label_encoder = LabelEncoder()
    one_hot_encoder = OneHotEncoder(dtype=int)
    for column in df.columns[1:-1]:
        features = df[column].values
        fit = label_encoder.fit_transform(features)
        features = one_hot_encoder.fit_transform(fit.reshape(-1,1))
        df_res[label_encoder.classes_] = features.toarray()
    df_res.to_csv(args.output, index=False)

python labels_encode.py --csv path_to_label --output path_to_output

编码后：

file,0-2,10-19,20-29,3-9,30-39,40-49,50-59,60-69,more than 70,Female,Male,Black,East Asian,Indian,Latino_Hispanic,Middle Eastern,Southeast Asian,White
train/1.jpg,0,0,0,0,0,0,1,0,0,0,1,0,1,0,0,0,0,0
train/2.jpg,0,0,0,0,1,0,0,0,0,1,0,0,0,1,0,0,0,0
train/3.jpg,0,0,0,1,0,0,0,0,0,1,0,1,0,0,0,0,0,0
train/4.jpg,0,0,1,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0
train/5.jpg,0,0,1,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0
train/6.jpg,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1
train/7.jpg,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,1,0,0
train/8.jpg,0,0,0,0,1,0,0,0,0,1,0,0,0,1,0,0,0,0
train/9.jpg,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1
train/10.jpg,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,1,0,0

训练

因为训练集有 8 万左右的图片，所以使用 Pytorch 的 DDP 来加速

python train.py --arch efficientnet-b6 --distributed --multi  --pretrained --num-classes 18 --epochs 100 -b 120 -j 24 --output output --val-csv labels/fairface_label_val.csv --vdata data --csv labels/fairface_label_train.csv data

使用了水平翻转来进一步增强数据，6 张卡的训练速度为 10 分钟一个 epoch，10 张 6 分钟。因为后续的 val_loss 不再下降了，所以没有完全训练完100轮，最终结果如下：

best：

[2021-04-20 22:50:32,362] [train] [I]: Training
[2021-04-20 22:59:10,779] [train] [I]: Epoch: [15] [700]/[722](96.95%) Loss: 0.1108 / 0.1359 / 0.1354 Acc: 0.91 / 0.86 / 0.86 Recall: 0.80 / 0.78 / 0.79
[2021-04-20 22:59:26,952] [train] [I]: Validating
[2021-04-20 22:59:46,176] [train] [I]: Epoch: [15] [50]/[92](54.35%) Loss: 0.1968 / 0.2196 / 0.2128 Acc: 0.71 / 0.77 / 0.77 Recall: 0.65 / 0.70 / 0.71

75:

[2021-04-21 08:23:40,830] [train] [I]: Training
[2021-04-21 08:32:05,544] [train] [I]: Epoch: [75] [700]/[722](96.95%) Loss: 0.0648 / 0.0919 / 0.0915 Acc: 0.96 / 0.92 / 0.92 Recall: 0.93 / 0.88 / 0.88
[2021-04-21 08:32:20,907] [train] [I]: Validating
[2021-04-21 08:32:37,897] [train] [I]: Epoch: [75] [50]/[92](54.35%) Loss: 0.2281 / 0.2691 / 0.2688 Acc: 0.74 / 0.78 / 0.77 Recall: 0.67 / 0.72 / 0.71

验证

简单得预测一些图来看一下结果

python inference.py --arch efficientnet-b6  --num-classes 18 --gpu 0 --num-visualize 32 --model path_to_your_model path_to_your_data

Code

Scripts