FaceID-1:Deep Learning Face Representation from Predicting 10,000 Classes 笔记

此文由香港中文大学汤晓鸥教授团队于2014年发表
论文链接:http://mmlab.ie.cuhk.edu.hk/pdf/YiSun_CVPR14.pdf

1.研究问题

主要通过神经网络学习图像特征,通过分类器验证人脸。

2.此文工作

2.1 人脸特征表达

2.1.1 网络结构

这里写图片描述
 一共四个卷积层,前三个卷基层后都有Max-pooling
 在最后一个隐藏层,是由Max-pooling layer3 + Convolutional layer4 全连接而得,为160维。这样的连接方式既考虑到了局部的特征,也考虑到全局特征
 最后的soft-max训练时使用,检测时不用,而如果使用soft-max进行分类、识别,效果很差
 用于人脸识别和人脸验证的特征是最后一个隐藏层,称为DeepID。

2.1.2 人脸特征

这里写图片描述
这里写图片描述
 将输入图片缩放为三个比例尺大小,并且分为彩色和灰度图像,最后还将图片切分为10个patch, 所以最后输入的patch 数为:3 2 10=60。
 对每一种patch 都训练一个卷积网络,一共需要训练60个卷积网络。
 所有patch 输出的特征连接起来,一共为19200(160 2 60),再利用PCA降维到150维用于人脸验证与区分。

2.2 人脸验证方法

2.2.1 联合贝叶斯

通过类内方差与类间方差之间的关系判断两个特征是否为一张脸。有一些推导,具体过程不详述。

2.2.2 神经网络

这里写图片描述
分成60个group,每个group对应一个patch,其中有160(单个网络输出)* 2(flip) * 2(对比的两张脸)=640维。输出为单一特征,表示相似性,由sigmoid生成。

2.3 实验与讨论

训练数据:CeleFaces+, 有10177人,202599张图片;8700人训练DeepID,1477人训练联合贝叶斯分类器。准确率达到97.45%
这里写图片描述
其他一些结论:
 使用multi-scale patch 的卷积网络效果比只用一张图片好
 训练样本中的身份数量越多,训练得出的模型越优
这里写图片描述

3.总结

提出将人脸图像分为多个patch, 对每个patch 分别训练神经网络,这样的效果明显优于纯粹输入图片训练。进一步提高了精度。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值