C3AE人脸年龄识别算法

本文转载自:https://blog.csdn.net/michaelshare/article/details/92076984

这篇文章是提出新的浅层网络来做人脸年龄估计的任务。

文章主要是利用小的浅层网络来处理低分辨率的图片,创新的点到不是很大,但是值得引人思考的是,对于一些低分辨率的图片是否可以不去用重量级的网络以及一些经典的连接就可以取得很好的效果。

文章分为三点去展开
第一是研究了一下mobilenet和shufflenet中的depth-wise卷积和标准的卷积在低分辨率图像任务中,是否真正能够减小网络参数。
第二是提出使用类似于one-hot的,两点表示人类年龄的方法。
第三是尽可能更多的采用图片的信息对年龄进行估计。

下面依次说明

一、重新审视标准的卷积在低分辨率图片中的压缩效果

这部分主要解释为什么本文采用标准卷积,而不是mobilenet和shufflenet里面提出的通道分离卷积,如群卷积和depth-wise卷积。
这里是从参数的量和对应的效果考虑。
在这里插入图片描述
所以从对图片特征提取效果和计算量综合考虑,本文采用了标准的卷积。

二、使用类似one-hot向量的两点表示法来表示年龄

在这里插入图片描述
在这里插入图片描述
其实扩展一下思考,年龄还可以用多点表示,例如50可以表示为50 = 0.5 × 0 + 0.5 × 100 = 0.2 × 10 + 0.2 × 40 + 0.2 × 60 + 0.2 × 90 50 = 0.5\times 0+0.5\times 100 = 0.2\times 10+0.2\times 40+0.2\times 60+0.2\times 9050=0.5×0+0.5×100=0.2×10+0.2×40+0.2×60+0.2×90,但是这种表示方式意义不大,对模型的训练没有什么指导意义。

三、级联训练(Cascade Training)

先给出一个形象的网络结构图,如下图所示
在这里插入图片描述
在这里插入图片描述

四、基于上下文的回归模型

为了更好的利用图片的信息,对于网络的输入文章将输入图片截取三次,如上图中的三种颜色的框,提取好三种输入后对特征进行concat操作,然后用于年龄的预估。

这里是怎么截取的,文章没有说的很明白

最后看看文章使用的网络结构如下表所示
在这里插入图片描述
文章没有很大的创新,主要是给人一种启发。人工设计的网络有可能存在冗余部分,对于一些任务没必要用很复杂的网络,比如本文的低分辨率图片的年龄预估,没必要使用很深的网络也能达到好的效果,文章还做了很多实验,详情可以查看原文。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值