link:http://lamda.nju.edu.cn/weixs/publication/iccvw15_AGE.pdf
思想:利用CNN来进行年龄估计,利用两种CNN模型,进行训练估计,最后将两个分支得到的结果进行融合,利用文章中的方法确定最后的数值。最后在竞赛中取得了第四名的成绩。
论文方法:
第一个阶段。关键词finetune,利用VGG-16训练好的model,具体步骤如下,1、在MORPH数据集上进行finetune,该数据集有55134张人脸图像,2、接着第一步,再在文章收集的两个数据集上来做finetune,于是得到两个不同的deep CNN 模型,第一个数据集包含27197张图像,从google下载,第二个数据集包含37606张图像,来源包括百度,必应,FG-NET和Alidence,3、最后用比赛中的数据集上在第二步骤得到的两个deep model上进行finetune,其中loss函数分别使用KL divergence和softmax。该数据集包含training和validation两个部分,4、通过前面两步,可以得到4个不同的deep models,它们可以提供不同的有用信息给待预测图像,将这些features连接起来,并且通过投票选择全体方法得到的距离最小的。x表示连接后的特征表示,在训练集中,用tn表示第n张图像的年龄,当一张新的图像来时,第一步需要计算这个图像的连接特征x*,再用下面的公式预测它表示的年龄:
第二个阶段:利用如下的cnn框架来训练:
1、利用收集到的数据来进行训练,这个collect data一共有119539张图片,除了比赛所用的数据集,其他所有文章中用的数据集全部融合到一起,变成一个数据集。2、用2479张训练和1136张验证图片在1上得到的model进行finetune,然后获得最终测试图像的预测年龄。为了提高准确率,采用了6中不同类型的输入,包括:RGB图像 等,并且随机水平和翻转50次,最后得到300个预测结果,最终的年龄估计取这300个结果的平均。
第三个阶段 :融合
如果前两个阶段得到的结果相差在11年以内,则取他们预测值的平均;如果超过11年,则直接取第一个阶段的预测结果作为最终的预测结果。
本文方法在比赛中的表现: