行人检索“An Improved Deep Learning Architecture for Person Re-Identification”

最新推荐文章于 2024-10-08 15:04:09 发布

cv_family_z

最新推荐文章于 2024-10-08 15:04:09 发布

阅读量6.2k

点赞数 3

分类专栏：深度学习行人检索

本文链接：https://blog.csdn.net/cv_family_z/article/details/49817033

版权

深度学习同时被 2 个专栏收录

105 篇文章 0 订阅

订阅专栏

行人检索

12 篇文章 0 订阅

订阅专栏

做行人检索的文章，输入是一对图像，网络输出这对图像的相似度值，新引入的网络层包括跨输入邻域差值层，根据图像对的卷积特征图计算局部关联，之后使用加和特征对输出特征图的邻域进行加和，最后计算远距离像素点的关联性。

检索包括两部分，特征提取和特征相似度衡量。
传统的特征提取方法：颜色直方图，LBP，Gabor，local patch。
相似度度量：M氏距离，LFDA，MFA。

网络架构：two layers of tied convolution with max pooling, cross-input neighborhood differences, patch summary features, across-patch features, higher-order relationships和一个softmax层估计输入的图像是否是同一个人。

这里写图片描述

1.Tied 卷积层
网络的前两层是卷积层，分别计算两个输入图像的卷积特征，两个视角的网络权值共享。网络输入RGB图像大小60*160*3，使用20个5*5*3的滤波器卷积，之后池化将特征图长宽减半，然后将特征图使用25个5*5*20的滤波器卷积，池化将特征图尺寸减半，最后得到的两个特征图大小为12*37。

2.跨输入邻域差值
两个绞在一起的卷积层分别提供了25个特征图，用于计算差值图 $K_i$ ，在5*5的邻域中计算差值，每个 $K_i$ 是12*37个5*5的网格，即，
这里写图片描述