文章阅读：Deep Face Recognition

最新推荐文章于 2020-10-17 18:38:40 发布

flying-cloud

最新推荐文章于 2020-10-17 18:38:40 发布

阅读量1.4k

点赞数 1

分类专栏：文章阅读

本文链接：https://blog.csdn.net/xiangych/article/details/50167825

版权

文章阅读专栏收录该内容

2 篇文章 0 订阅

订阅专栏

vgg-face的参考文章，作者是Omkar M. Parkhi，Andrea Vedaldi，Andrew Zisserman

Proceedings of the British Machine Vision Conference(BMVC), 2015

原文链接：https://www.robots.ox.ac.uk/~vgg/publications/2015/Parkhi15/parkhi15.pdf

文章中作者针对训练数据的采集问题提出一种构建大数据集的方法（ps：顺便牢骚一下Google的200M数据集）。数据集获取方法有很多，作者提出的方法个人认为是一种半自动的方法，节省了一定的人力和时间并且得到的数据纯度相对较高。

对于网络的训练过程，作者提出了triplet loss。就是在contrast loss的pair中再添加一个图像，构成一个由anchor image，positive image和negtive image组成的triplet。使用距离作为优化目标，减少anchor image与positive image的距离，增加与negtive image的距离。作者在实验中使用这种方法训练得到的deep CNN的性能可以可以与复杂程度更高的deep CNN媲美。这种训练方法可以将较小的deep CNN网络的性能提升到与更大的网络相近，消耗更少的资源。此外，通过在已有的三种不同复杂度的模型上进行实验比较，作者认为选取适当的训练方法可以让deep CNN得到近乎目前最好的结果。

选取作者结果分析中的以下三点：

1、对数据集中数据提纯前可能比提纯后得到更好的结果。作者的观点是：提纯前数据量较多得到的结果好，即使是多余的数据可能是label noise；被移除的数据可能是靠近决策边缘的数据，deep CNN会从中得到收益。个人比较感兴趣的是什么样的数据会对网络产生较大的影响，或者说deep CNN从哪些数据中得到更大的收益。

2、在训练集中做2D对齐不能提高网络性能，在测试集中做数据2D对齐可以提高网络性能。这个问题个人认为描述为：对训练集中数据进行平移变换能够提高网络泛化能力。

3、增加网络层数网络的性能略微下降可能是由于参数调整的原因。作者可能潜在地表达复杂结构的网络应该可以会得到更好的结果。