人脸属性识别的思考

最新推荐文章于 2022-06-29 19:00:02 发布

watersink

最新推荐文章于 2022-06-29 19:00:02 发布

阅读量1.8k

点赞数 4

分类专栏：人脸年龄，性别，颜值文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/qq_14845119/article/details/121524207

版权

人脸年龄，性别，颜值专栏收录该内容

10 篇文章 1 订阅

订阅专栏

6.eyeglass（yes,no），darkglass（yes,no）

在我们这个过度里，以你现在的速度，你只能逗留原地，如果你要抵达另一个地方，你必须以双倍于现在的速度奔跑。 ----红桃皇后定律

数据，数据

CelebA:（人脸属性） CelebA Dataset

raf:（人脸表情） Real-world Affective Faces (RAF) Database

Skin-Disease-Detection:（黑眼圈，痘痘，色斑，皱纹） https://github.com/gjain307/Skin-Disease-Detection.git

trade-off between visual quality and image diversity

一荣俱荣，一损俱损，

一件99%的事，胜过10件80%的事

登高而招，臂非加长也，而见者远；顺风而呼，声非加疾也，而闻者彰。假舆马者，非利足也，而致千里；假舟楫者，非能水也，而绝江河。君子生非异也，善假于物也。新数据集

star:中国100个明星数据集，（中国人）

多人类任务网络设计：

人脸识别vs表情识别：

多任务训练问题：

1.多任务训练过程中的此消彼长

2.类别不平衡问题

(1)加大权重，性别提升非常明显

(2)focal loss，有一定效果

3.难易学习问题

(1)【易】剪枝，【难】堆层，效果不行

4.年龄，分类替代回归

(1)万物皆可分

(2)stagewise思想，减少参数量，例如， (0 ∼ 10，10 ∼ 20，20 ∼ 30，30 ∼ 40，40 ∼ 50，50 ∼ 60，60 ∼ 70，70 ∼ 80，80 ∼ 90)==(0 ∼ 30，30 ∼ 60，60 ∼ 90)*（小，中，大）

5.表情识别界线模糊问题

7个类别，"happy":0, "angry":1, "calm":2, "scared":3, "sad":4, "disgust":5, "surprised":6

(1)堆数据

(2)全局收敛，定点迭代，局部调优 from large to small，from general to specific

(3)运气成分，极致精神cover smile属性

6.eyeglass（yes,no），darkglass（yes,no）

双2分类-->一3分类（eyeglass，darkglass，none）

优点，减少参数量，减少计算量

7.性别精度不足

(1)relu --->prelu:训练更稳定，89.86%-->91.09%-->92.31%-->92.92%

(2)adam--->sgd+momentum, 92.92%--->94.13%-->95.04%-->95.24%-->95.35%

(3)固定权重训练，不奏效

8.人脸关键点检测和人脸属性的适配问题

(1)好马还需好鞍配

9.左右眼问题

(1)特征split，侧脸无法覆盖

(2)排列组合，00，01，10，11，不奏效

(3)左右眼遮挡--->根据位置加遮挡--->去掉

(4)左右眼开闭，嘴巴开闭--->关键点计算---->模块放哪里

(5)左右眼遮挡--->106关键点分类

时间是金钱，细节是魔鬼：

pytorch 分类，回归的维度区别：

分类：torch.Size([512, N]) torch.Size([512])
回归：torch.Size([512]) torch.Size([512])

age_loss = smoothL1(net_output['age'].squeeze(), ground_truth['age_labels'])
错误：torch.Size([512, 1]) torch.Size([512])，导致训练发散，不收敛

pytorch的归一化和tf的区别，为什么pytorch可以不做归一化？

  train_transform = transforms.Compose([
        transforms.Resize(size =(128, 256)),
        transforms.RandomCrop(size = (112,224)),
        transforms.RandomHorizontalFlip(p=0.5),
        transforms.ColorJitter(brightness=0.3, contrast=0.3, saturation=0.3, hue=0),
        transforms.RandomAffine(degrees=20, translate=(0.1, 0.1), scale=(0.8, 1.2),
                                shear=None, resample=False, fillcolor=(255, 255, 255)),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ])

onnx：x = (x/255.0 -mean)/std

onnx slim:

pytorch 1.3:
torch.onnx.export(plfd_backbone, dummy_input, args.onnx_model, verbose=True, 
input_names=input_names, output_names=output_names, keep_initializers_as_inputs=True)

pytorch1.2:
torch.onnx.export(plfd_backbone, dummy_input, args.onnx_model, verbose=True,
input_names=input_names, output_names=output_names)

watersink

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
10
评论
人脸属性识别的思考

目录数据，数据多人类任务网络设计：人脸识别vs表情识别：多任务训练问题：1.多任务训练过程中的此消彼长2.类别不平衡问题3.难易学习问题4.年龄，分类替代回归5.表情识别界线模糊问题6.eyeglass（yes,no），darkglass（yes,no）7.性别精度不足8.人脸关键点检测和人脸属性的适配问题9.左右眼问题时间是金钱，细节是魔鬼：数据，数据CelebA:（人脸属性） http://mmlab.ie.cuhk.edu.hk/pro.
复制链接

扫一扫