最近看了两篇文章,以及老板布置的任务,把一些总结记录一下。
对于person re-identification任务来说, 天生就有多个camera 自然而然就有多个query的出现,zisserman 的文章主要是用到用户给予text信息,然后运用google image search得到多个ranked image,从而得到多个image。至于如何multi-query,主要有两类方法:
1.将多个query融合成为一个query,只进行一次retrieval。(这个方法在retrieval之前就丢失了信息,所以我认为并不好,实验结果也是如此显示的)
2.每个query进行一次retrieval,融合retrieval结果。(融合更多信息,其实是一个rerank的过程)
针对第二种方法,zisserman给出了3种方法
1.MQ-MAX: 融合时取得分最高的
2.MQ-AVG: 融合时取平均
3.MQ-ESVM: 这个方法用svm train,正样本是query set,负样本是random database image。学习的权值可以进行rank
zhengliang采用的方法则是仅仅采用可maxpooling 和averagepooling,以及一些不同的tricks。例如color name 特征(还没看)。weak geometric constraints、 gauss template
、以及multipe query 、rerank函数(是否能与上一篇论文相结合)
referenc: