《Deep Label Distrubution Learning for Appearent Age Estimation》阅读笔记

link:http://lamda.nju.edu.cn/weixs/publication/iccvw15_AGE.pdf

思想:利用CNN来进行年龄估计,利用两种CNN模型,进行训练估计,最后将两个分支得到的结果进行融合,利用文章中的方法确定最后的数值。最后在竞赛中取得了第四名的成绩。


论文方法:

第一个阶段。关键词finetune,利用VGG-16训练好的model,具体步骤如下,1、在MORPH数据集上进行finetune,该数据集有55134张人脸图像,2、接着第一步,再在文章收集的两个数据集上来做finetune,于是得到两个不同的deep CNN 模型,第一个数据集包含27197张图像,从google下载,第二个数据集包含37606张图像,来源包括百度,必应,FG-NET和Alidence,3、最后用比赛中的数据集上在第二步骤得到的两个deep model上进行finetune,其中loss函数分别使用KL divergence和softmax。该数据集包含training和validation两个部分,4、通过前面两步,可以得到4个不同的deep models,它们可以提供不同的有用信息给待预测图像,将这些features连接起来,并且通过投票选择全体方法得到的距离最小的。x表示连接后的特征表示,在训练集中,用tn表示第n张图像的年龄,当一张新的图像来时,第一步需要计算这个图像的连接特征x*,再用下面的公式预测它表示的年龄:


第二个阶段:利用如下的cnn框架来训练:


1、利用收集到的数据来进行训练,这个collect data一共有119539张图片,除了比赛所用的数据集,其他所有文章中用的数据集全部融合到一起,变成一个数据集。2、用2479张训练和1136张验证图片在1上得到的model进行finetune,然后获得最终测试图像的预测年龄。为了提高准确率,采用了6中不同类型的输入,包括:RGB图像 等,并且随机水平和翻转50次,最后得到300个预测结果,最终的年龄估计取这300个结果的平均。


第三个阶段 :融合

如果前两个阶段得到的结果相差在11年以内,则取他们预测值的平均;如果超过11年,则直接取第一个阶段的预测结果作为最终的预测结果。


本文方法在比赛中的表现:


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值