《论文阅读》Style Normalization and Restitution for Generalizable Person Re-identification

最新推荐文章于 2023-01-15 21:00:21 发布

未知丶丶

最新推荐文章于 2023-01-15 21:00:21 发布

阅读量1.9k

点赞数 1

分类专栏：深度学习计算机视觉文章标签：计算机视觉人工智能深度学习

本文链接：https://blog.csdn.net/qq_43310834/article/details/108940275

版权

深度学习同时被 2 个专栏收录

107 篇文章 13 订阅

订阅专栏

计算机视觉

91 篇文章 9 订阅

订阅专栏

留个笔记自用

Style Normalization and Restitution for Generalizable Person Re-identification

做什么

在这里插入图片描述
Person Re-identification行人重识别，给定一个查询图像（即源图像），行人重识别的目标是在多个不重叠的摄像机之间匹配人（即找到与源图像相同的人）

做了什么

在这里插入图片描述
Domain Adaptation Person Re-identification域自适应的行人重识别，常见的重识别的情况可能会遇到人物图像是由不同环境(例如光亮、季节)下的不同相机捕获。它们在照明、色调、色彩对比度和饱和度、质量、分辨率等方面呈现出很大的风格差异。这里采用的方法便是创造一个即插即用的风格归一化、样式化的框架SNR。

怎么做

在这里插入图片描述
显然这里的主要结构就是Style Normalization and Restitution（SNR）框架，实现Re-ID仅仅是在resnet-50的基础上增加了一些SNR模块得到的结果
那么接下来看看具体的结构

这里的输入记为F，是一个维度为h×w×c的feature map，最后的输出记为F⁺，维度与F相同，所以是即插即用的
SNR模块也分为了三个部分，Style Normalization Phase（SNP）风格规范化部分，Style Restitution Phase（SRP）风格恢复部分
首先是SNP部分
在这里插入图片描述
首先先经过一个Instance Normalization（IN）结构来归一化，减少特征的域差异。这里的μ是对每个样本通道单独的平均值计算，σ同理是标准差计算，γ和β都是参数，这是很常见的norm方式计算了

接下来是第二部分SRP部分
首先先将第一部分得到的F~和原F作差值
在这里插入图片描述
这里的R可以理解成原特征和归一化特征间的差异，然后将R分成两个部分，对两个部分做不同的mask处理

R由上是h×w×c维度的。这里的α是一个可学习的attention向量。是c维度的。则这里的α可以理解为去做一个不同通道下的恢复。也就是根据归一化特征和原特征的差异来对各部分进行不同attention的恢复
这里的a定义为
在这里插入图片描述
具体的计算也很好理解，没有特殊的结构，无非就是FC、pool、sigmoid、relu。这里的理解是通过
然后将提取的身份相关特征R⁺添加到风格归一化特征F~得到整个模块的最后结果

接下来是LOSS，这里设计了一个很特殊的LOSS，Dual Causality Loss Constraint双重因果损失约束。主要思想是:在将身份相关特征R⁺恢复到归一化特征F~之后，该特征变得更有区别性；另一方面，在将与身份无关的特征R重新映射到归一化特征F之后，该特征应该变得不那么有区别
这个LOSS由两个部分组成，想法也跟上面的两个相同
L_SNR = L_SNR⁺ + L_SNR^-
对一个batch。抽出其中的三张图片，包含了原普通图a，同类样本p，异类样本n（这里的同类异类指的是是不是同一ID）
在这里插入图片描述

两个LOSS的定义方式类似，首先是Softplus=ln(1 + exp(·)) ，显然这里是为了增大loss敏感性的同时防止有负数LOSS的出现，然后是d(x, y) = 0.5 - xTy/(2||x|| ||y||).，这里是带归一化的计算距离的方式，防止过大。这里的f_p是F_p即与a相同类的正类样本经过一层pool得到的结果，其他的f同理，带+和-即SNR中不同的结果
简单理解一下这两个LOSS，L_SNR⁺的第一行是为了使正类样本和原图的比较中，附加了身份相关特征的（即正号）比单纯归一化的结果更好，而在负类样本中，附加了身份相关特征的（即正号）比单纯归一化的结果更差，这里的两个LOSS皆是为了使R的作用凸显。
然后结合在这个Re-ID的任务中的LOSS就是总的LOSS
在这里插入图片描述
这里的L_SNR存在了四个是因为在Re-ID的网络中插入了4次

这里就展示了SNR的效果，显然可以很好地区分身份相关/不相关特征

总结

1.即插即用，永远的神
2.因果损失的设计方式值得借鉴

未知丶丶

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
《论文阅读》Style Normalization and Restitution for Generalizable Person Re-identification

留个笔记自用Style Normalization and Restitution for Generalizable Person Re-identification做什么Person Re-identification行人重识别，给定一个查询图像（即源图像），行人重识别的目标是在多个不重叠的摄像机之间匹配人（即找到与源图像相同的人）做了什么怎么做总结...
复制链接

扫一扫

专栏目录