【C3AE】《C3AE:Exploring the Limits of Compact Model for Age Estimation》

在这里插入图片描述

CVPR-2019



1 Background and Motivation

在这里插入图片描述

作者探索了一下在基于深度学习的年龄预测任务中,the limits of compact model for small scale image(小模型小输入),提出 Compact yet efficient Cascade Context-based Age Estimation model(C3AE)方法,在 IMDB-WIKI / Morph II / FG-NET 数据集上取得了惊艳的效果!

2 Related Work

  • Age Estimation
  • Compact Model

3 Advantages / Contributions

结合 Two Points Representation of Age 和多尺度输入,提出 C3AE,模型小,精度高

4 Method

在这里插入图片描述

Compact basic model, Casaced training and multi-scale Context

1)Compact Model for Smallscale Image: Revisiting Standard Convolution

比较正常 conv 和 depth-wise separable conv 的计算量

作者的结论是小网络,小输入,正常卷积的代价比 DWS卷积的小……

别慌,我们看看作者葫芦里卖的什么药

先看 mobilenet 论文中的公式(来自【MobileNet】《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》

在这里插入图片描述

小网络 N N N 再怎么小,也小不过 D K 2 D_K^2 DK2,作者是怎么得出深度可分离卷积比正常卷积计算量小的结论呢?

来看看作者的观点

the depth-wise convolution often requires much more channel numbers in order to perform comparable to standard convolution on small-scale images

在这里插入图片描述
两种 Conv 输入输出通道数 M M M N N N 都不一样,比了个寂寞……

好吧,跟着作者的诡辩,得出

M M ^ ⋅ N ^ + M N M ^ ⋅ N ^ ⋅ D K 2 = 144 32 × 32 + 144 × 144 32 × 32 × 3 2 = 2.39 > 1 \frac{M}{\hat{M} \cdot \hat{N}} + \frac{MN}{\hat{M} \cdot \hat{N} \cdot D_K^2} = \frac{144}{32 \times 32} + \frac{144 \times 144}{32 \times 32 \times 3^2} = 2.39 > 1 M^N^M+M^N^DK2MN=32×32144+32×32×32144×144=2.39>1

输入输出通道都比别人小了 4 倍多,计算量才是别人 1 2.39 \frac{1}{2.39} 2.391……

2)Two Points Representation of Age
在这里插入图片描述
利用两点来表示年龄
在这里插入图片描述
对于第 n n n 张图片的年龄 y n y_n yn,我们可以用两个整数的 z n 1 z_n^1 zn1 z n 2 z_n^2 zn2 (年龄 y n y_n yn 落在年龄间隔之间, z n 1 z_n^1 zn1< y n y_n yn< z n 2 z_n^2 zn2)加权来表示,加权系数为 λ 1 \lambda_1 λ1 λ 2 \lambda_2 λ2 λ 1 + λ 2 = 1 \lambda_1 + \lambda_2 = 1 λ1+λ2=1

比如,68 可以用 60 和 70 加权表示, 68 = 60 ∗ 0.2 + 70 ∗ 0.8 68 = 60 *0.2 + 70 * 0.8 68=600.2+700.8

当年龄间隔区间服从( z n 2 − z n 1 = K z_n^2 - z_n^1 = K zn2zn1=K)均匀分布的时候,

年龄可以重新表示为
在这里插入图片描述
在这里插入图片描述

z n 1 = ⌊ y n K ⌋ ⋅ K z_n^1 = \left \lfloor \frac{y_n}{K} \right \rfloor \cdot K zn1=KynK

z n 2 = ⌈ y n K ⌉ ⋅ K z_n^2 = \left \lceil \frac{y_n}{K} \right \rceil \cdot K zn2=KynK

实验中 K = 10 K = 10 K=10

这样我们可以通过分布的形式来监督年龄了(可以理解为 two-hot)

假设 K = 10,范围 10~80岁,则年龄区间为, { 10 , 20 , 30 , 40 , 50 , 60 , 70 , 80 } \{10, 20, 30, 40, 50, 60, 70, 80\} {10,20,30,40,50,60,70,80}(对应图 2 中的 w 2 w_2 w2

68 的 two-hot(Distribution y ⃗ \vec{y} y ) 为 [ 0 , 0 , 0 , 0 , 0 , 0.2 , 0.8 , 0 ] [0, 0, 0, 0, 0, 0.2, 0.8, 0] [0,0,0,0,0,0.2,0.8,0]

这样可以监督 two-hot 的分布了,不是单纯的 regression 68,也不需要像 one-hot 那样 80-10+1 类

但是 Each point can also be represented by two points or any other more points

eg 50 = 0.5 × 0 + 0.5 × 100 = 0.2 × 10 + 0.2 × 40 + 0.2 × 60 + 0.2 × 90 50 = 0.5 \times 0+0.5 \times100 = 0.2 \times10+0.2 \times 40+0.2 \times 60+0.2 \times 90 50=0.5×0+0.5×100=0.2×10+0.2×40+0.2×60+0.2×90

所以网络怎么监督也很关键,作者采用了 cascade 的方式

3)Cascade Training

I n → c o n v X → w 1 y n ⃗ → w 2 y n I_n \overset{conv}{\rightarrow} X \overset{w_1}{\rightarrow} \vec{y_n} \overset{w_2}{\rightarrow} y_n InconvXw1yn w2yn

在这里插入图片描述

y n ⃗ \vec{y_n} yn 也即 distribution y ⃗ \vec{y} y

KL 监督 two-hot 分布
在这里插入图片描述
MAE 监督年龄
在这里插入图片描述
在这里插入图片描述
实验中 α = 10 \alpha = 10 α=10

4)Context-based Regression Model

多尺度输入

在这里插入图片描述

5 Experiments

5.1 Datasets and Metrics

1)数据集

  • IMDB-WIKI
    523051 images,0~100岁,noise 比较多,本文仅用于 pre-train
    在这里插入图片描述

  • Morph II
    55000 face images of 13000 subjects with age label,16~77岁,平均 4 images per subject
    在这里插入图片描述

  • FG-NET
    1002 face images from 82 non-celebrity subjects,0~69 岁,平均 12 images per subject
    在这里插入图片描述

2)评价指标

mean absolute value (MAE)

5.2 Ablation Study

1)the Plain Model of C3AE

精度

在这里插入图片描述
Morph II(M-MAE), IMDB (I-MAE) and WIKI (W-MAE)

速度
在这里插入图片描述
train-val loss
在这里插入图片描述
residual 结构和 SE block
在这里插入图片描述
res 的引入增大了 error,SE 的引入降低 error

2)Cascade and Context Module
在这里插入图片描述
在这里插入图片描述

横坐标 w 2 w_2 w2,纵坐标 y n ⃗ \vec{y_n} yn ,上面一行是多尺度输入的结果,下面是各个单尺度输入的结果

但尺最后一个 bin 学的不太准,92.73 和 55.49,应该是 80,作者给出的解释为

we found that there are only 9 samples in the range [70, 80], and it is easy to explain why the last element is abnormal.

5.3 VS SOTA

1)Comparison with State-of-the-arts on Morph-II
在这里插入图片描述
2)Comparison with State-of-the-arts on FGNET
在这里插入图片描述

6 Conclusion(own) / Future work

摘抄一些优秀的论文解读:

逻辑回归
原始的逻辑回归只解决二分类问题,由二分类问题进而也可以扩展到多分类问题。参考李航的《统计学习方法》。
分类问题可用于对猫,狗,鸟,花等的分类。

有序回归
但是,当不同类别的类别之间有一定的顺序关系时,仅仅使用分类损失是不够的。
比如:我们对人的年龄进行分类:0 岁,1 岁和 2 岁。这时仅仅使用分类损失是不够的。
如果一个样本的真实年龄是0,如果用分类方法,我们把它的年龄分类成 1 岁和 2 岁时的损失是相等的。但是,明显1岁要比2岁,更加接近于 0 岁,1 岁是一个比 2 岁更可被接受的分类。因此从应用意义上,1 岁应该比 2 岁有更小的损失。
有序回归就是解决这个问题,除了考虑分类损失以外,还要考虑误分类的类别和真实类别之间的排序关系,排序更近的损失应该更小。

  • 在这里插入图片描述
### 回答1: 移动电子健康应用程序的未来:探索HTML5作为C的开发平台。 移动电子健康应用程序在过去几年中迅速发展,成为医疗行业的重要组成部分。随着移动设备普及率的提高,人们越来越多地使用智能手机和平板电脑来管理和监测健康状况。未来,这种趋势将继续增长,并且我们可以期待移动电子健康应用程序的需求将更加多样化和复杂化。 在开发移动电子健康应用程序时,HTML5是一种值得探索的开发平台,尤其是在C语言环境下。HTML5是一种现代化的标记语言,为开发者提供了许多新的功能和工具,可以用于构建各种移动应用程序。 首先,HTML5具有跨平台的优势。无论是在iOS、Android还是其他操作系统上,HTML5应用程序都可以进行开发和运行,这为开发者带来了更广泛的受众基础。它还不需要任何额外的插件或软件,使得应用程序更容易被用户接受和使用。 其次,HTML5提供了丰富的多媒体支持。移动电子健康应用程序可能需要展示各种类型的健康数据,如图表、图片和视频等。HTML5的多媒体功能可以帮助开发者在应用程序中轻松地集成这些元素,以便于用户更好地理解和管理自己的健康状况。 此外,HTML5还具有良好的互联互通性。它可以与云计算技术和其他网站服务进行集成,使用户能够轻松地访问和共享健康数据。这种互联互通性为医疗行业提供了更多的合作机会,促进了移动电子健康应用程序的进一步发展。 总之,HTML5作为移动电子健康应用程序的开发平台具有巨大的潜力。它跨平台、提供多媒体支持和良好的互联互通性,能够满足不断增长的移动电子健康应用程序需求。在未来,我们可以期待HTML5在C语言环境下的应用得到更多的开发和创新。 ### 回答2: 移动电子健康应用程序的未来:探索HTML5用于C语言的开发。 移动电子健康应用程序的未来十分看好,而HTML5为C语言的开发提供了许多新的机遇。HTML5是一种用于构建网页和Web应用程序的标准技术,它的灵活性和可移植性使其成为移动电子健康应用程序开发的有力工具。 首先,HTML5提供了更丰富的用户体验。通过使用HTML5的标准化元素和功能,开发人员可以创建更具吸引力和直观的移动电子健康应用程序。这意味着用户可以更轻松地浏览内容、交互和操作移动电子健康应用程序,从而提高了其使用的便利性。 其次,HTML5的跨平台特性使得开发和部署移动电子健康应用程序更加容易。传统上,C语言被广泛用于移动应用开发,而使用HTML5可以将移动电子健康应用程序轻松地跨平台到不同的设备和操作系统上。这样,开发人员可以更快速地将应用程序推向市场,提高了开发的效率和可扩展性。 此外,HTML5还提供了强大的图形和多媒体处理能力。移动电子健康应用程序通常需要处理复杂的图表、图像和视频等内容,而HTML5提供了丰富的图形和多媒体功能,使开发人员能够更直观地展示和处理这些数据。这对移动电子健康应用程序的可视化和数据分析非常重要。 然而,HTML5也存在一些挑战。与传统的原生应用程序相比,HTML5应用程序可能性能略逊一筹。此外,开发过程中需要考虑设备的兼容性和安全性等问题,以确保移动电子健康应用程序的可靠性和安全性。 总体来说,随着移动电子健康应用程序市场的不断增长和HTML5技术的发展,HTML5用于C语言的开发在未来将发挥重要作用。开发人员可以利用HTML5的灵活性、可移植性和丰富的功能,创建更具吸引力和易用性的移动电子健康应用程序,从而为用户提供更好的健康管理体验。 ### 回答3: 移动电子健康应用程序的未来:探索HTML5用于C 移动电子健康应用程序开发一直是关注的热点,随着技术的不断进步和人们对健康的关注度增加,我们可以预见未来的发展方向。HTML5是一种流行的开发技术,已广泛应用于Web应用程序开发中。那么,将HTML5与C语言结合,是移动电子健康应用程序开发领域的一大趋势。 首先,HTML5具有跨平台的特点。移动电子健康应用程序在不同的操作系统和设备上运行,兼容性是一个重要的问题。HTML5可以跨平台运行,不受特定操作系统或设备的限制,使得开发人员可以更加便捷地创建应用程序。 其次,HTML5具有丰富的功能和交互性。移动电子健康应用程序需要展示各种健康数据、提供交互操作和界面,以及实时更新数据等功能。HTML5提供了多种元素和API,开发人员可以根据需求自由定制用户界面,并实现与用户的交互操作。此外,HTML5还支持多媒体和实时通信,可以提供更丰富的用户体验。 再次,HTML5支持离线应用程序。对于移动电子健康应用程序来说,有时在没有网络连接的情况下,用户仍然希望能够使用一些功能和数据。HTML5提供了离线存储和缓存功能,可以将应用程序的核心功能和数据缓存到本地,使得用户在离线情况下仍然能够访问和使用一部分功能。 最后,HTML5具有不断更新和发展的潜力。随着技术的进步,HTML5的功能将不断增强,开发人员可以充分利用这些新特性来提升移动电子健康应用程序的性能和体验。 综上所述,HTML5与C语言结合是移动电子健康应用程序开发的未来趋势。通过使用HTML5,开发人员可以实现跨平台、丰富功能、离线支持等优势,提供更好的用户体验和便捷的开发方式,推动移动电子健康应用程序的发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值