1709.HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis 论文笔记

最新推荐文章于 2022-01-19 22:34:47 发布

leeboosunny

最新推荐文章于 2022-01-19 22:34:47 发布

阅读量1.6k

点赞数 1

分类专栏：行人重识别文章标签：行人再识别 HydraPlus reid 深度学习论文笔记

本文链接：https://blog.csdn.net/xuluohongshang/article/details/79018343

版权

行人重识别专栏收录该内容

28 篇文章 3 订阅

订阅专栏

HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis
面向行人分析的注意力深度特征表达—HydraPlus（“九头蛇”）网络
代码资源：https://github.com/xh-liu/HydraPlus-Net

论文信息：
这里写图片描述

论文介绍：
行人分析属于细粒度的行人识别任务，如行人属性识别和行人ID再识别，作者提出了一个新颖的基于注意力机制的深度学习网络，架构在inception-V2之上，该网络的优势是能有效整合多级（low-level/semantic-level等）和对尺度下的多种注意力机制特征来丰富最终的特征表达，实验结果显示网络提取的多注意力特征具有互补性，整合后的特征具有更好的细粒度特征表达能力。

作者分别在行人属性识别的数据集和Re-ID数据上做了实验。

所解决问题的动机：如下图所示，引入来自多层级的多尺度注意力特征并整合全局和局部到一个特征向量上
1.Semantic-level全局的特征能定位局部注意力感兴趣区域获得更好的不同行人的判别性（如长发还是短发，长袖还是短袖，有无带帽）
2.Low-level（较低层提取的特征）捕获的多为条纹或纹理特征，如衣服的pattern
3.Scales则是有助于描述行人的特点，如小尺度注意力特征图有无打电话等行为或者大特征注意力特征图的行人整体理解，如判别男女。
这里写图片描述

模型框架：
这里写图片描述

采用多向网络即在Main Net（M-Net）的基础上加入Attentive Feature Net（AF-Net）,而MFN有三个分支，每个分支有三个inception-V2的Block单元和一个MDA（multi-directional attention）模块（多向是指不同MFN分支上，MDA应用于在不同级别Blocks特征提取上，即MDA处理后的特征图与三个临近的blocks元素乘的连接，即可认为每个MDA有三个输出分支），注意力特征图从不同的语义layers中提取，可抽象出同一行人的不同的视觉模式；
用全局均值池化（GAP）和一个全连接层（FC）联结从M-Net和AF-Net得到的全局和局部多级别多尺度特征，进行最后特征的整合；
作者的创新性设计体现在AF-Net的设计上，即引入来自多层级的多尺度注意力特征并整合全局和局部到一个特征向量上；
In principle, any kind of CNN structure can be applied to construct the HP-net.作者则采用了inception v2 architecture

一个MDA的处理过程：如下图
MDA module includes two components:
(1) attention map generation with black solid lines；
(2) attentive features by masking the attention map to different levels of features in hot dash lines.
这里写图片描述

HP-Net训练：
HP-Net训练步骤比较繁琐：in a stage-wise fashion，先训练M-Net，完后再被复制三次得到AF-Net的三个分支，每个MDA模块有三个子分支组成，即临近的三个不同的inception blocks，依次微调每个blocks，即共有9个blocks需要微调，对于行人重识别任务，用softmax loss最小化输出层loss。

实验：

Multi-level Attention Maps
下图，以每个输入图像提取某level的L = 8 attention channels 的特征图，来说明不同MDA作用下，多级注意力特征的定性演示：
这里写图片描述
Fig. 4(a). We observe that the attention map from earlier layer i = 1 prefers grasping low-level patterns like edges or textures, while those from higher layers i = 2 or 3 are more likely to capture semantic visual patterns corresponding to a specific object (e.g. handbag) or human identity.

Multi-Directional Attentive Features
这里写图片描述

Component Analysis
这里写图片描述

Person Re-identification
这里写图片描述

Pedestrian Attribute Recognition
这里写图片描述

leeboosunny

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
1709.HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis 论文笔记

HydraPlus-Net-Attentive Deep Features for Pedestrian Analysis 面向行人分析的注意力深度特征表达—HydraPlus（“九头蛇”）网络代码资源：https://github.com/xh-liu/HydraPlus-Net论文信息：论文介绍：行人分析属于细粒度的行人识别任务，如行人属性识别和行人ID再识别，作者提出了一个新颖的
复制链接

扫一扫