《Deep Label Distrubution Learning for Appearent Age Estimation》阅读笔记

最新推荐文章于 2022-03-24 22:05:15 发布

沧海1梦

最新推荐文章于 2022-03-24 22:05:15 发布

阅读量1.1k

点赞数

分类专栏： paper 文章标签： paper face age

本文链接：https://blog.csdn.net/cwt19902010/article/details/49445055

版权

paper 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

link:http://lamda.nju.edu.cn/weixs/publication/iccvw15_AGE.pdf

思想：利用CNN来进行年龄估计，利用两种CNN模型，进行训练估计，最后将两个分支得到的结果进行融合，利用文章中的方法确定最后的数值。最后在竞赛中取得了第四名的成绩。

论文方法：

第一个阶段。关键词finetune，利用VGG-16训练好的model，具体步骤如下，1、在MORPH数据集上进行finetune，该数据集有55134张人脸图像，2、接着第一步，再在文章收集的两个数据集上来做finetune，于是得到两个不同的deep CNN 模型，第一个数据集包含27197张图像，从google下载，第二个数据集包含37606张图像，来源包括百度，必应，FG-NET和Alidence，3、最后用比赛中的数据集上在第二步骤得到的两个deep model上进行finetune，其中loss函数分别使用KL divergence和softmax。该数据集包含training和validation两个部分，4、通过前面两步，可以得到4个不同的deep models，它们可以提供不同的有用信息给待预测图像，将这些features连接起来，并且通过投票选择全体方法得到的距离最小的。x表示连接后的特征表示，在训练集中，用tn表示第n张图像的年龄，当一张新的图像来时，第一步需要计算这个图像的连接特征x*，再用下面的公式预测它表示的年龄：

第二个阶段：利用如下的cnn框架来训练：

1、利用收集到的数据来进行训练，这个collect data一共有119539张图片，除了比赛所用的数据集，其他所有文章中用的数据集全部融合到一起，变成一个数据集。2、用2479张训练和1136张验证图片在1上得到的model进行finetune，然后获得最终测试图像的预测年龄。为了提高准确率，采用了6中不同类型的输入，包括：RGB图像等，并且随机水平和翻转50次，最后得到300个预测结果，最终的年龄估计取这300个结果的平均。

第三个阶段：融合

如果前两个阶段得到的结果相差在11年以内，则取他们预测值的平均；如果超过11年，则直接取第一个阶段的预测结果作为最终的预测结果。

本文方法在比赛中的表现：