人脸识别系列（八）：VGGFace

最新推荐文章于 2024-10-29 17:54:12 发布

Fire_Light_

最新推荐文章于 2024-10-29 17:54:12 发布

阅读量1.6w

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fire_Light_/article/details/79593778

版权

本文介绍VGGFace数据集的构建过程，该数据集包含2.6M张图像及2.6K个人物，通过多阶段筛选确保质量。文中还讨论了一种基于CNN的人脸识别方法，并对比了不同规模数据集的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文链接与数据集下载：VGGFace—-Deep Face Recognition

本文主要内容有二：
1）从零开始构建一个人脸识别数据库，一共 2.6M images, over 2.6K people，构建过程主要是程序实现的，少量人工参与。
2）通过对比各种CNN网络，提出了一个简单有效的CNN网络，在各种公开的人脸识别数据库上得到很好的效果。

VGGFace DateSet

构建过程主要分为5个阶段

1阶段在IMDB网站上获得名人名字的名单列表，这个和CASIA-Webface有点像

2阶段是通过谷歌来扩大每个人的图片量

3阶段使用一个Fisher Vector Faces descriptor 与SVM清除一些错误的图片

4阶段清除一些一样的照片，因为从不同网站上爬下来的照片，难免会有所重复。

5阶段再人工清除一些照片

各阶段的统计数据如下：

这里写图片描述

比较花时间的是2阶段和5阶段，其余都很快。

这是与其他数据集的比较：

这里写图片描述

网络结构

基于VGG自己的数据集，构建了如下的CNN,用来进行人脸识别

这里写图片描述

看图片的描述，作者说这是VGGNet中的A结构，但是参考VGGNet论文中的结构表（如下），博主认为却是D结构，不知道是不是作者写错了，但是影响不大。
这里写图片描述

使用Softmax在VggDataSet上预训练。

在进行验证时，在最后一层输出的2622维的特征（即对应每一类的概率）还会被用来以Tripletloss做一个度量学习
这里写图片描述

度量学习是一个全连层，使用目标数据集（LFW）的训练集部分训练。

通过训练好的度量学习层，获得人脸的1024维特征表达，然后直接以欧式距离来作为人脸是否为同一个脸的判定依据。

这一做法和百度的论文其实是十分相似的，其实两篇论文发表的时间也相近，都是15年。

实验：

这里写图片描述
此表的训练数据Data有d和f两种，分别对应的是构建数据集时3阶段的数据（清理前）和5阶段的数据（清理后）
通过这里可以发现，使用更大但是有更多错误的数据集对网络能力有提高作用，原因一是因为数据量更大，二是因为小的数据集可能被清除了一些hard positive的数据，使得网络无法从这些数据里受益。

LFW得分：

这里写图片描述

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。