| |
论文名称
|
Deep Learning Face Representation from Predicting 10,000 Classes
|
作者
|
miclover
|
参考
|
|
摘要
| |
通过深度神经网络来提取人脸深层次的特征,
称为深度隐藏身份特征(deep hidden IDentity features, DeepID),用于人脸验证。
在对深层次的特征提取之后,结合分类器进行分类,文中使用了两种分类方法:
联合贝叶斯人脸校验( Joint Bayesian)
和
神经网络方法(neural network)
。
| |
| |
一、特征提取过程
箭头表示正向传播方向。每一层是神经元个数标记如下。从每个卷积神经网络的最后一个隐层提取深度人脸特征,并在最后一层使用softmax进行分类。特征数沿着特征提取逐层减少,直到DeepID层。
论文中说,一共被训练有60个不同参数的深度网络,每一个网络有两个特征块(一张人脸将被得分成60块*2,这里的2是指对那60个块进行翻转或对称)被传入。DeepID层得到160维度的特征,因此DeepID总共将获得2*60*160 = 19200维度特征,作为最后被提取的人脸特征。再下图中Identity classes个人理解是为了方便可以让网络正常训练而使用的,在训练过程有用,在测试阶段则是使用DeepID层特征来分类。
二、Deep ConvNets
长方体的长度、宽度和高度表示所有输入层、卷积层和最大池化层的映射数和每个映射的维数。内部的小长方体和正方形分别表示卷积层和maxpooling层的3D卷积核大小和2D pooling区域大小。每一层的旁边都标有最后两层完全连接的神经元数目
三、Feature extraction
对于一张人脸图片,在经过人脸检测和人脸对齐之后,作者按照瞳孔和嘴的位置对所有训练样本进行了对齐(保证后面的切片工作是同一尺度下的),然后根据特征点的位置,进行了切块提取。
如下图所示:
1)上半部分是按要求对一张人脸提取十个不同的位置。
左上角的5个区域是从排列较弱的人脸中提取的全局区域,右上角的5个区域是以5个面部标志(两个眼睛中心、鼻尖和两个鼠标角)为中心的局部区域。
2)下半部分,对这十张分别进行2次尺度变化,得到30张不同位置的人脸。
3)又对上述30张RGB图片,提取了灰度图像上的特征,这样就变成60张了
4)之后每一张图作对称或水平翻转,变成了120张
四、Face verification
使用卷积神经网络或者联合贝叶斯等分类器,对特征进行分类,如下图,卷积神经网络输出1或者0,表示是不是相同。
| |
|
【DeepID】人脸识别模型之DeepID框架
最新推荐文章于 2024-06-21 13:40:38 发布