ICCV2019-行人重识别-Beyond Human Parts: Dual Part-Aligned Representations for Person Re-Identification

再困也得吃

于 2020-02-27 16:46:21 发布

阅读量1.5k

点赞数

分类专栏：行人重识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38208912/article/details/104539310

版权

行人重识别专栏收录该内容

13 篇文章 4 订阅

订阅专栏

动机：

这是一篇基于part，之后对于每个part添加了self-attention的文章。作者出发点在于当前结合human parsing的part re-id方法只能对人体部分检测，不能对一些装饰物，例如包，帽子等检测，而这些外部装饰也是重识别不可或缺的元素，却被当作background，这当然会降低精度。
在这里插入图片描述

创新：

作者提出了DPB网络，该网络主要由人体区域语义提取部分（human part branch）和self-attention（lantent part branch）结合。
在这里插入图片描述

human part branch：该网络直接采用CE2P网络框架，提取得到了K个part（K-1个人体区域+1个非人体区域）的特征图，之后与原特征图融合后得到了与原来等大小的特征图。
lantent part branch：该网络使用了self-attention，得到与原特征图等大小的feature mask
融合：将原特征图，human part特征图和latent part特征图相加，得到最终的特征。

架构：

在这里插入图片描述
架构特征：单流结构
特征：通过多层插入的DPB得到的特征
损失函数：CE loss+triplet loss
backbone：resnet50

实验：

对比不同的数目的K对结果的影响，发现K越大，细粒度越高，则精度越高。这里K=1时输入为原图；K=2时输入为人整体和背景；K=5时，包括背景、头、上半身、下半身和鞋
在这里插入图片描述
这里作者做了个有意思的对比实验，当K=2时，即只有人的整体区域和背景区域时，作者有意分开他们俩做了个对照实验，发现当只有背景区域时，其效果要好于只有人的整体区域。也就是说，背景区域包含的信息可能会更具有区分性
在这里插入图片描述

结果在加入triplet loss后，从94.0提升到了95.2

疑惑：

作者展示了部分背景区域相关系数高的样本，但是这些样本的高相关区域并不是装饰物，而是天空等背景，这种案例应该是这个方法目前不足的地方。
在这里插入图片描述

再困也得吃

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ICCV2019-行人重识别-Beyond Human Parts: Dual Part-Aligned Representations for Person Re-Identification

动机：这是一篇基于part，之后对于每个part添加了self-attention的文章。作者出发点在于当前结合human parsing的part re-id方法只能对人体部分检测，不能对一些装饰物，例如包，帽子等检测，而这些外部装饰也是重识别不可或缺的元素，却被当作background，这当然会降低精度。创新：作者提出了DPB网络，该网络主要由人体区域语义提取部分（human part...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。