此文由Face++团队于2014年发表
论文链接:https://arxiv.org/abs/1403.2802
1.研究问题
使用深度神经网络提取特征,提出金字塔神经网络。
2.此文工作
2.1 金字塔神经网络
网络结构(论文里没有讲清楚具体细节,只给了大概结构):
网络为Siamese network
输入为不同的图像patch, 也就是不同的人脸部位
整个网络由很多个level 的网络组成
每个level 上的网络由共享的层和不共享的层组成,共享的层由之前的level 训练得到,此level 只训练不共享的层
每个level 有多个神经网络,它们对应于不同的patch 但是它们的第一层的参数是相同的
最后的特征为所有网络输出连接组成(训练时),这样的特征为多尺度特征,也是过完全特征,但是文中说明了过完全对结果有好处,而且特征可以通过PCA 降维,降维后的特征分类识别能力也很强(即使降到8维,正确率也能达到80%以上)
检测时使用的特征是最后一个level 的输出
采用金字塔网络的原因:
加快网络训练
获得多尺度人脸特征
网络训练的损失函数:
目标:使同一个人的距离相近,不同人的距离相远。
网络的训练方法:
2.2 实验结果
准确率(LFW)97.27%
训练时间与准确率:(证明他们的方法可以加快训练)
3总结
优点:定义了一个新的神经网络的结构:金字塔神经网络,并且人脸识别效果相较于传统方法有巨大提高。文章最后总结:由于人脸是高度结构化的图片,所以可以应用金字塔神经网络,但是普通物体具有很大的可变性,不太好应用。
缺点:没有说清楚网络结构和参数,也没有讲清楚训练数据集的来源与大小。