FaceID-1：Deep Learning Face Representation from Predicting 10,000 Classes 笔记

最新推荐文章于 2021-04-19 15:45:47 发布

kunyXu

最新推荐文章于 2021-04-19 15:45:47 发布

阅读量748

点赞数

分类专栏： Face Recognition 文章标签：深度学习人脸识别

本文链接：https://blog.csdn.net/kunyxu/article/details/54376325

版权

Face Recognition 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

此文由香港中文大学汤晓鸥教授团队于2014年发表
论文链接：http://mmlab.ie.cuhk.edu.hk/pdf/YiSun_CVPR14.pdf

1.研究问题

主要通过神经网络学习图像特征，通过分类器验证人脸。

2.此文工作

2.1 人脸特征表达

2.1.1 网络结构

这里写图片描述
 一共四个卷积层，前三个卷基层后都有Max-pooling
 在最后一个隐藏层，是由Max-pooling layer3 + Convolutional layer4 全连接而得，为160维。这样的连接方式既考虑到了局部的特征，也考虑到全局特征
 最后的soft-max训练时使用，检测时不用，而如果使用soft-max进行分类、识别，效果很差
 用于人脸识别和人脸验证的特征是最后一个隐藏层，称为DeepID。

2.1.2 人脸特征

这里写图片描述

 将输入图片缩放为三个比例尺大小，并且分为彩色和灰度图像，最后还将图片切分为10个patch，所以最后输入的patch 数为：3 2 10=60。
 对每一种patch 都训练一个卷积网络，一共需要训练60个卷积网络。
 所有patch 输出的特征连接起来，一共为19200（160 2 60），再利用PCA降维到150维用于人脸验证与区分。

2.2 人脸验证方法

2.2.1 联合贝叶斯

通过类内方差与类间方差之间的关系判断两个特征是否为一张脸。有一些推导，具体过程不详述。

2.2.2 神经网络

这里写图片描述
分成60个group，每个group对应一个patch，其中有160（单个网络输出）* 2（flip） * 2（对比的两张脸）=640维。输出为单一特征，表示相似性，由sigmoid生成。

2.3 实验与讨论

训练数据：CeleFaces+，有10177人，202599张图片；8700人训练DeepID，1477人训练联合贝叶斯分类器。准确率达到97.45%
这里写图片描述
其他一些结论：
 使用multi-scale patch 的卷积网络效果比只用一张图片好
 训练样本中的身份数量越多，训练得出的模型越优