人脸识别系列(八):VGGFace

论文链接与数据集下载:VGGFace—-Deep Face Recognition

本文主要内容有二:
1)从零开始构建一个人脸识别数据库,一共 2.6M images, over 2.6K people,构建过 程主要是程序实现的,少量人工参与。
2)通过对比各种CNN网络,提出了一个简单有效的CNN网络,在各种公开的人脸识别数据库上得到很好的效果。

VGGFace DateSet

构建过程主要分为5个阶段

1阶段在IMDB网站上获得名人名字的名单列表,这个和CASIA-Webface有点像

2阶段是通过谷歌来扩大每个人的图片量

3阶段使用一个Fisher Vector Faces descriptor 与SVM清除一些错误的图片

4阶段清除一些一样的照片,因为从不同网站上爬下来的照片,难免会有所重复。

5阶段再人工清除一些照片

各阶段的统计数据如下:

这里写图片描述

比较花时间的是2阶段和5阶段,其余都很快。

这是与其他数据集的比较:

这里写图片描述

网络结构

基于VGG自己的数据集,构建了如下的CNN,用来进行人脸识别

这里写图片描述

看图片的描述,作者说这是VGGNet中的A结构,但是参考VGGNet论文中的结构表(如下),博主认为却是D结构,不知道是不是作者写错了,但是影响不大。
这里写图片描述

使用Softmax在VggDataSet上预训练。

在进行验证时,在最后一层输出的2622维的特征(即对应每一类的概率)还会被用来以Tripletloss做一个度量学习
这里写图片描述

度量学习是一个全连层,使用目标数据集(LFW)的训练集部分训练。

通过训练好的度量学习层,获得人脸的1024维特征表达,然后直接以欧式距离来作为人脸是否为同一个脸的判定依据。

这一做法和百度的论文其实是十分相似的,其实两篇论文发表的时间也相近,都是15年。

实验

这里写图片描述
此表的训练数据Data有d和f两种,分别对应的是构建数据集时3阶段的数据(清理前)和5阶段的数据(清理后)
通过这里可以发现,使用更大但是有更多错误的数据集对网络能力有提高作用,原因一是因为数据量更大,二是因为小的数据集可能被清除了一些hard positive的数据,使得网络无法从这些数据里受益。

LFW得分:

这里写图片描述

  • 3
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值