关于人脸年龄估计研究的调研报告
一. 研究背景与意义
年龄信息作为人类的一种重要生物特征,在人机交互领域中有着众多应用需求,并且对人脸识别系统的性能有着重要影响。基于人脸图像的年龄估计是指应用计算机技术对人脸图像随年龄变化的规律进行建模,从而使机器能够根据面部图像推测出人的大概年龄或所属的年龄范围。如果基于人脸图像的年龄估计问题得到解决,那么在日常生活中,基于年龄信息的各种人机交互系统将在现实生活中有着极大的应用需求。通过年龄估计系统自动判断人的年龄,实现安全网络或安全门禁控制,这对保护未成年人的健康成长尤其重要;在电子顾客管理系统中,通过摄像头采集人脸图像并自动进行年龄估计,可以实现对各年龄段顾客的消费特点和产品喜好进行自动、无干扰地收集与分析,从而便于对不同年龄段的顾客进行产品开发并提供有针对性的营销服务;年龄变化所带来的人脸外貌变化对人脸别系统的性能有着非常重要的影响,年龄信息作为一种生物特征,除了会对使用者的身份认证提供有效的信息外,也将大大提高多年龄人脸识别系统的性能。
二. 主要内容和方法
2.1 年龄特征提取
年龄特征提取的主要目的是从人脸图像或图像序列中提取能够表征年龄变化的特征值,稳定而有效的年龄特征能够大大提高年龄估计系统的性能,并降低年龄估计算法的难度。人在成长过程中,其人脸形状、脸部纹理、皮肤颜色、面部斑点、皮肤松弛度、发际线等都有着不同程度的变化,研究者根据这些变化来提取各种面部年龄特征。根据特征所反映的人脸信息,将常用的人脸年龄特征分为形状特征、纹理特征、代数特征以及混合特征。
人体测量学模型
利用人体测量学模型进行人脸描述是人脸特征提取领域研究最早的一种模型,其研究可以追溯到Kwon 等人[1]的研究,该方法的主要思想是基于颅面发展理论。颅面发展理论的数学模型是在关于颅面增长的心理物理学研究中所提出的一种“修正”曲线拉伸模型。该模型认为颅骨的变化与所受压力的大小和方向有关,因此可用一个充满液体的球体来模拟颅骨的变化。
Kwon 等人[1,2]最早采用人体测量学模型对人脸图像进行年龄特征提取,他们采用可变形模板和Snakelets 能量函数进行人脸轮廓检测并在此基础上进行人脸特点定位,然后计算出6 种几何比例用于小孩年龄段与其他年龄段的区分。这6 种比例值分别是: 两眼之间的间距/鼻子与眼睛的间距、两眼之间的间距/眼睛与嘴巴的间距、两眼之间的间距/眼睛与下巴的间距、眼睛与鼻子的间距/眼睛与嘴巴的间距、眼睛与嘴巴的间距/眼睛与下巴的间距、头部与下巴的间距/眼睛与下巴的间距。Horng 等人[3] 根据人脸的对称性特点,采用Sobel 边缘检测法进行特征点定位和区域标记,提取出嘴巴与眼睛的间距/两眼之间的间距、两眼中心与鼻子的间距/鼻子与嘴巴的间距两种比例特征。
柔性模型
柔性模型将人脸的形状与灰度/纹理有机结合起来,用统计的方式建立人脸模型。其典型的代表是主动形状模型和主动外观模型( AAM)。AAM[4]是由Cootes 等人提出的一种人脸统计模型,是主动形状模型的延伸,它在形状模型的基础上添加了全局纹理模型。Lanitis 等人[5]首次将AAM 应用于基于人脸图像的年龄估计特征提取中,建立年龄与人脸特征参数之间的函数关系。
采用该模型进行特征提取时,将会丢失掉很多局部纹理信息,可能不利于对老年人进行年龄估计。在训练过程中,柔性模型通常将形状和纹理空间分别进行训练,这将会损失掉大量纹理和形状之间的有效信息。此外柔性模型的确定依赖于很多脸部特征点的准确定位,一旦定位出现误差,这种误差将很容易在后续处理中被放大。
特征子空间模型
由于每个人的衰老过程都是非常复杂且不可控制的,它不仅与健康状况、生活方式和天气条件等有关,同时还受到遗传基因的影响。为了解决人脸衰老过程中的个性化问题,Geng 等人[6]提出了一种年龄特征子空间模型。该模型由同一个人不同年龄时期的一组人脸图像决定,按时间顺序将每个对象不同年龄的人脸图像组合在一起构成该个体的年龄模式,将不同个体的年龄模式按照一定的关系进行映射就得到年龄模式空间。在该模式中,如果每个年龄值的人脸图像都存在,则该模型称为完整年龄模型,否则该模型称为不完整年龄模型。
在AGES年龄模型中,人脸图像在图像序列中的位置点对应该人的年龄值。该模型集人脸重构与年龄估计于一体,把每个人的变老过程作为一个独立的年龄模式,自然地将个人身份与时间相结合,把基于完整数据库的年龄估计问题转化为非完整数据库的年龄估计问题,大大降低了年龄数据库的收集难度。但在实际建立AGES 模型时,需要同一个人多幅不同年龄的图像来建立子空间,因此该模型将不适合一些年龄数据库,如YGA 数据库; 同时AGES 模型采用柔性模型对人脸图像进行特征提取,而柔性模型主要是对形状和全局纹理特征进行提取,因此在人脸重构阶段,可能无法很好地对人脸的局部纹理进行重构。
流形学习模型
流形学习旨在发现高维数据集分布的内在规律性,从采样数据学习得到低维流形的内在几何结构或者内在规律。因此年龄特征的流形学习就是寻找一种特征空间,将人脸原始图像数据通过该特征空间转化为一组低维年龄特征用于年龄估计中。Guo 与Fu 等人通过实验比较了典型的维数降解和嵌入式流形学习方法,并基于UIUC-IFP-Y年龄数据库对PCA、局部线性嵌入算法( LL