论文提要“Learning Deepface Representation”

最新推荐文章于 2020-01-25 17:41:40 发布

cv_family_z

最新推荐文章于 2020-01-25 17:41:40 发布

阅读量948

点赞数 1

分类专栏：人脸识别深度学习

本文链接：https://blog.csdn.net/cv_family_z/article/details/48975027

版权

深度学习同时被 2 个专栏收录

105 篇文章 0 订阅

订阅专栏

人脸识别

26 篇文章 1 订阅

订阅专栏

提出来金字塔CNN（PCNN）做人脸识别，使用greedy-filter-and-down-sample算子，在多尺度上特征共享描述人脸，学习到的8维特征在LFW数据库测试达到97.3%的结果。

传统的人脸识别步骤有预处理，低层编码，特征转换，高层特征表示。深度网络将这些步骤一体化，直接对图像像素进行分析，信号经历多层非线性变换，与人工设计的多步骤方法类似。

这里写图片描述

人脸描述是从图像像素映射到数值向量
$f:\mathbb R^{h\times w}\rightarrow \mathbb R^m$
好的人脸描述方法标准
Indentity-preserving
Abstract and compact
Uniform and automatic
一般通过监督学习最小化损失L实现，非监督学习也能够挖掘出数据的模式，但他们的优化目标与识别任务不直接相关，因此学习到的表示容易受到光照，表情和姿态的影响。

Pyramid CNN
1.Indentity-preserving学习
对人脸对进行学习，属于或不属于同一个人的人脸对由相集得到。使用Siamese网络处理人脸对，使用同一个CNN处理两张图片生成对应的表示。输出节点使用距离函数比较两个图片的表示，预测图像对是否属于同一个人，损失函数是：
$L=\sum_{I_1,I_2}log(1+exp(\delta(I_1,I_2)D(I_1,I_2)))$
$D(I_1,I_2)=\alpha \cdot d(f_{\theta}(I_1),f_{\theta}(I_2))-\beta$
其中 $\delta(I_1,I_2)$ 表示两个图像是否是同一个人， $f_{\theta}$ 为神经网络计算出的结果，d是衡量两个向量间距离的函数。 $\theta$ 是网络的权值， $\alpha,\beta$ 是可训练的参数。
2.网络结构
卷积网络是高阶非线性实值多方差函数，由多层卷积和下采样实现：
$I^{i+1}=P_{max}(g(I^i\bigotimes W^i+B^i))$
g是非线性激活函数，卷积及下采样算子为：
$(I^i\bigotimes W^i)_{x,y,z}=\sum_{a,b,c,z}I^i_{x-a,y-b,c}W^i_{a,b,c,z}$
$P_{max}(I^i)_{x,y}=\max_{0<=a,b<s}I^i_{xs+a,ys+b}$
金字塔CNN的目的是加速深度网络的训练，并使用人脸的多尺度结构。下图是PCNN的结构。
这里写图片描述
每个网路包含共享部分和非共享部分，非共享部分每级的结构相同。同一级上可能有多个网络，它们活跃在不同的区域上并共享他们第一层的参数，用来补偿低层网络对输入区域的低聚合特性。
训练过程可分解为训练几个小型的网络：
这里写图片描述

第一级的网络比较小，在人脸的局部区域上训练。训练完第一级后，第一层固定，固定层用来滤波及下采样训练图像。第二级网络在处理后的图像上训练。这样网络输入的大小不随着层级的增加而增加，这个训练步骤持续到所有的级被训练到。

PCNN是一个多尺度特征提取框架，不同尺寸的图像块将在不同的尺寸级输入到网络。

实验结果
在LFW上的实验结果如下：
这里写图片描述

cv_family_z

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文提要“Learning Deepface Representation”

提出来金字塔CNN（PCNN）做人脸识别，使用greedy-filter-and-down-sample算子，在多尺度上特征共享描述人脸，学习到的8维特征在LFW数据库测试达到97.3%的结果。传统的人脸识别步骤有预处理，低层编码，特征转换，高层特征表示。深度网络将这些步骤一体化，直接对图像像素进行分析，信号经历多层非线性变换，与人工设计的多步骤方法类似。人脸描述是从图像像素映射到数值向量 f:R
复制链接

扫一扫