age estimation阅读整理（一）

最新推荐文章于 2024-12-19 13:17:59 发布

g28_gerwulf

最新推荐文章于 2024-12-19 13:17:59 发布

阅读量1.1k

点赞数 1

分类专栏： CV age estimation 文章标签： age estimation

本文链接：https://blog.csdn.net/g28_gwf/article/details/108001050

版权

CV 同时被 2 个专栏收录

4 篇文章

订阅专栏

age estimation

1 篇文章

订阅专栏

Attended End-to-end Architecture for Age Estimation from Facial Expression Videos
系统整合了CNN与RNN，在时间和空间上都增加注意力模块
方法：在CNN中添加空间注意力模块，得到的embedding送入包含时间注意力模块的RNN中。
loss：MAE
数据集：UvA-NEMO Smile Database、UvA-NEMO Disgust Database
评价指标：MAE、标准差、P value of t-test
在实验中得出几个结论：相同年龄间隔下较多的样本数目有助于网络挖掘潜在特征、眼底区域/鼻梁/法令纹/嘴周围的区域在表情变化时产生的皱纹有助于系统进行年龄估计、表情从无到有的过程包含了大量信息，而表情消失后的人脸仍然包含重要的信息、自然的表情中包含的信息相比故意做出的表情更有区分度

Deep Age Estimation Model Stabilization from Images to Videos
在实际试验中发现直接将CNN得到的特征映射到年龄上的方法在面对视频数据时缺乏稳定性，因此作者引入了注意力机制筛选CNN得到的特征。提出了一个视频数据集、一种视频数据集上的评价指标
方法：CNN特征提取 + 注意力机制
loss：MSE + 预测值与预测值的差（后者用于控制预测值的稳定性）
数据集：使用了一段二十分钟长的视频（视频中只有一个人），将其裁剪成5692个片段作为视频数据集。
训练：CNN在Morph上进行正常的回归训练。注意力模块在视频数据集上训练。
评价指标：在视频数据集上的MAE和方差

Age and Gender Recognition in the Wild with Deep Attention
方法：系统包含三个结构：attention CNN、Patch CNN、classifier。attention CNN提取原始的低分辨率图片的特征，并给出一个k * k的矩阵，物理意义为将原始图片的高分辨率版本划分为k * k格时每一格对应的注意力分数；Patch CNN提取原始图片的高分辨率版本的特征并平均池化，输出一个长度为k * k的特征向量，与attention CNN的输出矩阵flatten后merge在一起；classifier对attention CNN和Patch CNN进行处理并得到分类结果
数据集：Morph、Adience（61.8 ± 2.，95.1 ± 0.03，Adience上年龄估计未达到SOTA）、IoG（60.0，94.5，比较的方法中的最好效果）
评价指标：MAE（Morph）、accuracy（Exact、1-off）
两个结论：在年龄和性别估计任务上CNN比使用LBP的SVM的特征提取效果更好；最好的注意力加权方法为逐元素相乘、merge方法为正则化后concat

BridgeNet: A Continuity-Aware Probabilistic Network for Age Estimation
方法：提出Gating网络，通过Bridge Tree这一结构获得临近回归任务的权值，更好地进行年龄的回归预测

Soft-ranking Label Encoding for Robust Facial Age Estimation
方法：提出了soft-ranking编码方法，不同于LDL与hard-ranking，这种编码方法能够有效区分临近的特征，并且可以进行任意两个年龄的对比。同时使用patch操作（Maskout method）处理训练数据，添加五个辅助branch，挖去特征图上对应人脸的区域并正常训练，以此规范化特征提取器，减轻过拟合，测试时仅使用主branch
数据集：MORPH2（MAE：1.67（RS）、2.71（SE））、AgeDB（MA：0.581）、ChaLearn15（MAE：0.232、ε-error：0.274）
评价指标：MAE、ε-error

Age estimation via attribute-region association
方法：将原始人脸图片和人脸上的眼、鼻、嘴特写分别送入三个网络
数据集：MORPH2、FGNET、CACD
评价指标：MAE、CA

Video Age Estimation with Multiple Stacked CNN Models
方法：将0-100划分为5个年龄段，使用一个较为简单的网络将特征进行5分类，再使用较为复杂的5个网络对第一个模型结果进行20分类（这里感觉很迷，第一个网络的最后一层是softmax layer，怎么送到后面的CNN网络里的呢？）
loss：softmaxloss + center loss
数据集：在CASIA上预训练，audience、FGNET、Morph上finetune，The ICCV2016 Apparent Age Estimation Challenge上测试
评价指标：mean normalized error

Real-Time Age and Gender Estimation from Face Images
方法：Hierarchical multi-classifier。假设有八个类别，将数据递归地划分为两个子类，使用Adaboost进行训练。
loss：Correct Classification Rate

Deep label refinement for age estimation
方法：通过一系列神经网络进行年龄的回归和年龄分布的回归任务，每一个网络都会学习前一个网络的预测结果并不断减小与gt的差异。同时作者提出了relax loss，使得每一个网络相比之前的网络预测结果都更加稳定、接近gt
数据集：IMDB-WIKI、ChaLearn15（MAE：3.052、ε-error：0.274）、MORPH2（MAE：1.905）、MegaAge-asian（CA3：64.45 CA5：82.95 CA7：91.98）
评价指标：MAE、ε-error、CA