SSR-Net软阶段回归网络的年龄预测

SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation

创新点:阶段回归与动态范围

DEX方法

DEX方法,将整个年龄的回归问题分解为分类问题。将整个年龄区间 Y = [0; V ] 分解为s个不相交的子区间,每一个子区间的宽度为w,W=v/s,那么第i个子区间ui=i*(V/s)。最终预测的年龄为每一个区间的概率和,即

                                  

为了使得模型更加精确,DEX方法设置每一个bin的宽度为1岁,也就是对于 Y = [0::100],一共有101个bin。本质就是在0-100之间的101类分类后,对于得到的分数(softmax)和对应的label(0-100)相乘,并将最终结果求和,得到最终识别的年龄。但是这样参数量比较大。 

网络为VGG16,预先在ImageNet上进行分类训练,然后在IMDB-WIKI数据集上进行微调。

单独回归器训练的时候,将VGG16最后一层神经元改为1个,从而获得回归年龄。

单独分类器训练的时候,最后一层神经元数目改为101进行分类,从而获得每个类别的概率。 最终通过将分类器各个类别概率与对应的年龄相乘,得到网络预测的年龄:

                                                      

阶段回归 

本文基于DEX方法的基础上,提出了阶段回归方法。 假设年龄一共0-90岁,区间宽度为10,那么DEX方法的全连接层就需要9个神经元 (0 ∼ 10,10 ∼ 20,20 ∼ 30,30 ∼ 40,40 ∼ 50,50 ∼ 60,60 ∼ 70,70 ∼ 80,80 ∼ 90)。而采用多stage策略后,第一个stage只需要3个神经元 (0 ∼ 30,30 ∼ 60,60 ∼ 90),第二个stage在第一个stage的基础上,也只需要3个神经元,因为第一层的3个stage共用第二层的3个神经元,即第二层的stage在第一层stage的基础上,只需要区分(小,中,大)就可以实现0-90岁的分类了。2个stage加起来,只需要6个神经元就可以达到。SSR-Net采用由粗到精的策略,分多个阶段进行多类分类。每个阶段只负责细化前一阶段的决策,以便更准确地估计年龄。因此,每个阶段执行的任务类很少,需要的神经元也很少,这大大减少了模型的大小。 SSR-Net通过允许根据输入的人脸图像进行移动和缩放,为每个年龄类分配一个动态范围。

阶段回归的优点是每个阶段的类的数量很少,导致更少的参数和更紧凑的模型。
假设我们想估算0 ~ 90岁范围内的年龄(V =90),分成三个阶段(K = 3),每个阶段有三个小区间(s1 = s2 = s3=3) 。

 

动态范围

将年龄区间统一划分为不重叠的区间,在处理年龄组模糊性和年龄连续性上缺乏灵活性。在粗粒度上,问题甚至更严重。我们通过为每个区间引入一个动态范围来解决这个问题;也就是说,我们允许每个区间根据输入图像进行移动和缩放。 

SSR-Net网络结构 

 Soft Stagewise Regression           

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码字神经元

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值