文章阅读:Deep Face Recognition

vgg-face的参考文章,作者是Omkar M. Parkhi,Andrea Vedaldi,Andrew Zisserman

Proceedings of the British Machine Vision Conference(BMVC), 2015

原文链接:https://www.robots.ox.ac.uk/~vgg/publications/2015/Parkhi15/parkhi15.pdf


  文章中作者针对训练数据的采集问题提出一种构建大数据集的方法(ps:顺便牢骚一下Google的200M数据集)。数据集获取方法有很多,作者提出的方法个人认为是一种半自动的方法,节省了一定的人力和时间并且得到的数据纯度相对较高。

  对于网络的训练过程,作者提出了triplet loss。就是在contrast loss的pair中再添加一个图像,构成一个由anchor image,positive image和negtive image组成的triplet。使用距离作为优化目标,减少anchor image与positive image的距离,增加与negtive image的距离。作者在实验中使用这种方法训练得到的deep CNN的性能可以可以与复杂程度更高的deep CNN媲美。这种训练方法可以将较小的deep CNN网络的性能提升到与更大的网络相近,消耗更少的资源。此外,通过在已有的三种不同复杂度的模型上进行实验比较,作者认为选取适当的训练方法可以让deep CNN得到近乎目前最好的结果。

      选取作者结果分析中的以下三点:

1、对数据集中数据提纯前可能比提纯后得到更好的结果。作者的观点是:提纯前数据量较多得到的结果好,即使是多余的数据可能是label noise;被移除的数据可能是靠近决策边缘的数据,deep CNN会从中得到收益。个人比较感兴趣的是什么样的数据会对网络产生较大的影响,或者说deep CNN从哪些数据中得到更大的收益。

2、在训练集中做2D对齐不能提高网络性能,在测试集中做数据2D对齐可以提高网络性能。这个问题个人认为描述为:对训练集中数据进行平移变换能够提高网络泛化能力。

3、增加网络层数网络的性能略微下降可能是由于参数调整的原因。作者可能潜在地表达复杂结构的网络应该可以会得到更好的结果。


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值