此篇论文同样由香港中文大学汤晓鸥教授团队于2014年发表
论文链接:http://xueshu.baidu.com/s?wd=paperuri%3A%28107f066157bf469540490ec52b0e65cd%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Farxiv.org%2Fabs%2F1412.1265&ie=utf-8&sc_us=5787535078988981639
1.研究问题
在DeepID2的基础上进一步改善网络和结果,并分析网络神经元的特性。
2.此文工作
2.1 网络结构及改进
相比于DeepID2的改进:
四个卷积层都增加到128个特征图
特征输出增加到512维
验证信号作用于每一个max-pooling 层特征
训练数据增加到1.2万个身份29万张图
DeepID 为所有max-pooling 层特征相连
有非常多的patch, 仍然选取25个patch
2.2 实验与讨论
2.2.1 实验结果(LFW 99.47%)
2.2.2 适度稀疏与二值性
DeepID2+ 对每个人的人脸,最后的DeepID 层都大概只有半数的单元是激活的,半数为不激活的。不同的人,激活的单元不同。基于此性质,使用阈值将输出的512维向量进行二值化处理,发现进度降低有限。二值化的好处:通过计算汉明距离就可以进行检索,计算加快。
2.2.3 特征区分性
存在某个神经元,只使用普通的阈值法,就能针对某个人得到97%的正确率。不同的神经元针对不同的人或不同的性别、年龄都具有很强的区分性。
2.2.4 遮挡鲁棒性
在训练数据没有被遮挡的情况下,DeepID2+ 具备对遮挡的鲁棒性,两种遮挡方式:
3.总结
进一步改进了DeepID 系列,精度进一步提高。并且探讨验证了输出神经元的适度稀疏性、特征区分性和遮挡鲁棒性。