简介
本文提出了一个统一的framework,同时最大化特征和Metric的优势。其实这并不是新的思想,然而作者的创新在于:
(1)强调Joint representation,将两张Images拼成一张输入,force网络学习判别特征,并在后面的实验中验证这种联合表示的优势;
(2)不同于以往的得到的是单张图片的feature,测试需要求probe 和gallery 间的Euclidean 和cosine,他们输出的直接是图片间的相似度;
(3)本文的最大创新,应当是提出了一个learning-to-rank的算法,如果正匹配排在了最前面则不产生loss,排的越靠后loss越大。若rank unit中,只有一个负sample的话,本质上就成为了传统的triplet loss。作者最后实验中采用了1:2的正负比例进行训练。
(4)本文的看点:
a.采用了Alexnet的网络架构,对于该网络架构的分析值得一看(如:max-pooling增强对小变化的鲁棒性,pooling后的LRN帮助产生对光照和对比度鲁棒的特征;Dropout减少过拟合);
Alexnet:
http://blog.csdn.net/sunbaigui/article/details/39938097
b.实验分析:一方面和state-of-art methods, cnn-based比,还评估了在open-world和across datasets的性能;另一方面是自我分析。
##笔记
E:\CSDN\joint_rank