走进MOT系列 (五) --《Omni-Scale Feature Learning for Person Re-Identification》翻译理解

OSNet是一种轻量级的深度CNN架构,专门用于学习行人重识别(ReID)任务中的全方位特征。通过多卷积特征流捕获不同尺度的特征,并使用动态聚合门进行多尺度融合,以克服ReID中的实例变化和外观相似性挑战。OSNet在六个ReID数据集上表现出最先进的性能,同时在对象分类和多标签属性识别任务上也展现出高效性。
摘要由CSDN通过智能技术生成

大佬阅读笔记参考:https://blog.csdn.net/weixin_42731241/article/details/91415598
code:https://github.com/KaiyangZhou/deep-person-reid

摘要

作为实例级识别问题,人员重新识别(ReID)依赖于判别特征,其不仅捕获不同的空间尺度而且还封装多个尺度的任意组合。我们将这些特征称为同构和异构尺度的全尺度特征。在这篇论文中,一部新颖的深刻CNN被设计为全称网络(Omni-Scale Network OSNet),用于ReID中的全方位特征学习。这是通过设计由多个卷积特征流组成的残差块来实现的,每个卷积特征流检测特定尺度的特征。重要的是,引入了一种新颖的统一聚合门,以动态融合多尺度特征和输入相关的信道方向权重。为了有效地学习空间通道相关性并避免过度拟合,构建块使用逐点和深度卷积。通过逐层堆叠这些块,我们的OSNet非常轻量级,可以在现有的ReID基准测试中从头开始进行训练。尽管模型尺寸较小,但我们的OSNet在六个ReID数据集上实现了最先进的性能

引言

人的重新识别(ReID),是一项基础性的任务。分布式多摄像头监控,旨在匹配人群出现在不同的非重叠相机视图。作为一个实例级识别问题,面临两个主要挑战如图1所示。首先,行人之间(实例/标识)的变化通常很大,原因在于
相机观察条件的变化。例如,图1(a)和(b)中的两人都背着背包;视图相机之间的变化(从正面到背面)会给背包区域带来很大的外观变化,使之与背包的尺寸相匹配同一个人困难。其次,人们在公共场所穿着相似的衣服。
在监控录像中,它们看起来惊人的相似图中的四个人。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值