论文阅读：轻量级reid：Learning Generalisable Omni-Scale Representations for Person Re-Identification

最新推荐文章于 2024-05-14 09:41:14 发布

liyu0611

最新推荐文章于 2024-05-14 09:41:14 发布

阅读量1.1k

点赞数

分类专栏：论文文章标签： reid 轻量级

本文链接：https://blog.csdn.net/liyu0611/article/details/102702413

版权

论文专栏收录该内容

10 篇文章 0 订阅

订阅专栏

论文地址：
https://arxiv.org/pdf/1910.06827.pdf
Github：
https://github.com/KaiyangZhou/deep-person-reid

摘要

有效的行人再识别模型应该学习特征表示，这些特征表示既可以用于区别外观相似的人员，又可以在无需任务调整下用于跨数据集部署。

在本文中，我们提出了新的CNN架构来应对这两个挑战。首先，我们提出了一个被称为全尺度网络（OSNet）的CNN来学习特征，它不仅可以捕捉不同的空间尺度，而且可以封装多个尺度的协同组合，即全尺度特征。基本构建块由多个卷积流组成，每个卷积流检测一定范围内的特征。对于全尺度特征学习，提出了一种统一的聚合门，将多尺度特征与信道权值动态融合。OSNet是轻量级的，因为它的构建块包含分解卷积。

其次，为了改进通用特征学习，我们在OSNet中引入实例规范化层来处理跨数据集的差异。为了确定这些层在体系结构中的最佳位置，我们提出了一种有效的可微体系结构搜索算法。

大量的实验表明，在传统的相同数据集设置下，尽管OSNet比现有的re-ID模型要小得多，但它仍能实现最先进的性能。在更具挑战性和实用性的跨数据集设置中，OSNet击败了最新的无监督域自适应方法，同时并不需要任何目标数据来进行模型自适应。

2 related work

（1）Multi-Scale and Multi-Stream CNNs
基于ResNeXt，（多流相同尺度），OSNet（多流不同尺度）；

建立网络在Inception [ 46 ]，[47]上，其中inception多个流是最初专为降低计算成本而设计，精心设计的卷积层和池化层的混合物。在相比之下，我们的构建基块使用比例控制因子使要捕获的空间比例多样化。

在轻量化设计方面，我们的OSNet是与MobileNet相似，但凭经验修改的排序更好地为全尺度特征的学习。
（2）Domain Generalisation
unsupervised domain adaptation (UDA) methods [7], [8], [9], [10]：
DG methods [54], [55]
adapted for DG [56]
Our DG re-ID solution is based on adding instance normalisation (IN) layers [13].use neural architecture search to optimally explore the capability of IN in DG
多尺度动态融合模块思想如下：
在这里插入图片描述

3 OMNI -S CALE N ETWORK FOR P ERSON R E -ID

可分离卷积：lite模式后再加个conv1x1如图4更高效。
在这里插入图片描述
（1）主要是动态聚合多尺度特征
动态尺度融合是通过一种新型的聚合门（AG），这是一种可学习的神经网络,且 shared。
G is implemented as a mini-network composed of a non-parametric global average pooling layer [69] and a multi-layer perceptron (MLP) with one ReLU-activated hidden layer, followed by the sigmoid
activation. To reduce parameter overhead, we follow [70],[71] to reduce the MLP’s hidden dimension with a reductionratio, which is set to 16.
the AG is shared across all the feature streams in the same omni-scale residual block
在这里插入图片描述
网络结构如下：
AIN为自动搜索插入IN(instance normalisation)层的构架。（Different from batch normalisation (BN), which normalises each sample using statistics computed over a mini-batch,IN performs normalisation on each sample using its own mean and standard deviation）在这里插入图片描述
与之前resnext和inception网络的区别：

严格遵循OSNet中的多流设计指数决定的比例递增原理；
具体来说，不同的流具有不同的重新感知场，但使用相同的Lite 3×3布局，这样的设计可以更有效地覆盖各种scale；inception是原始的通过共享设计最终具有较低的计算成本具有多个流的计算，
鉴于OSNet旨在有选择地融合多个不同接收场大小的特征流为了学习全方位的功能

liyu0611

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：轻量级reid：Learning Generalisable Omni-Scale Representations for Person Re-Identification

论文地址：https://arxiv.org/pdf/1910.06827.pdfGithub：https://github.com/KaiyangZhou/deep-person-reid摘要有效的行人再识别模型应该学习特征表示，这些特征表示既可以用于区别外观相似的人员，又可以在无需任务调整下用于跨数据集部署。在本文中，我们提出了新的CNN架构来应对这两个挑战。首先，我们提出了一个被...
复制链接

扫一扫