概述
这是一篇icpr2010的文章,主题是人脸年龄估计,虽然年代已经十分久远,并且使用的也是传统机器学习方法(SVM)而非时下流行的深度学习,但文章中的ranking approach的思想仍然沿用至今.
文章首先提到,做年龄估计主要有两种方法:一种是多分类,把年龄的具体数值(整数)当成类别,这种做法的主要问题在于没有考虑到类别之间的相互联系,认为类与类之间是无关的,效果并不好;另一种是当作回归问题,这种做法虽然考虑到了年龄的具体数值之间的内在联系,但却忽略了人的老化并不是静态的过程,从5岁到10岁的变化和50岁到55岁的变化显然是不相同的,而在回归的度量函数中却认为是等价的,所以也存在缺陷.
作者认为,只有年龄之间的相对关系是稳定不变的,并且基于人们更善于比较两个人的年龄关系而非直接估计的观察,提出了用 SVM实现的ranking approch,将原本的多分类问题转变为若干个二分类问题.
方法
假设年龄的分布是1~70岁,那么整个年龄估计的大问题就分成了69个子问题,每个子问题都是一个二分类问题,分别为:是否大于1岁,是否大于2岁...是否大于69岁(显然不可能大于70岁).对于每个二分类问题,都用如下形式进行计算:
也就是用若干平行的超平面(仅仅是偏置不同)对样本进行划分,每个f(xi,k)就是xi对于第k个二分类的输出结果.
函数φ(xi)是SVM理论的核函数中的映射,将xi从样本空间映射到高维空间,用于解决线性不可分问题.
最终,对于每个样本xi的年龄估计结果如下:
实验
分别在Morph和FG-NET两个数据集上实验,在CS和MAE两项指标中都取得了state-of-the-art的结果.
总结
这篇文章基于年龄这一标签独有的性质,提出了将多分类问题转化为多个二分类问题的重要方法,可以说为后面的ordinal regression理论在年龄估计这一领域的发展奠定了基础.