论文阅读-Tracklet self-supervised learning for unsupervised person re-identification2020_AAAI阅读笔记

最新推荐文章于 2023-01-30 18:59:30 发布

sykai1

最新推荐文章于 2023-01-30 18:59:30 发布

阅读量444

点赞数

分类专栏：深度学习笔记

本文链接：https://blog.csdn.net/sykai1/article/details/118525363

版权

深度学习笔记专栏收录该内容

17 篇文章 36 订阅

订阅专栏

本文仅是自己学习所记，请谨慎采纳，如有错误不妥之处欢迎各位朋友指正！

研究背景

现有的无监督行人re-id方法，主要集中于跨域适应和one-shot学习上。虽然这些方法的可扩展性要比监督学习好，但是对相关的标记源域的依靠和每个人都初始化一个已经标记的轨迹限制了它在现实应用中的可扩展性。

论文内容

算法的整体结构如下图所示：

因为不使用行人特征的标签，所以构建了三个自监督学习约束来完成模型训练：

tracklet连续帧学习
tracklet紧密度学习
tracklet聚类结构学习

tracklet连续帧学习

直接使用轨迹中的帧，并不是最优选择，因为轨迹是由一小段时间的窗口抓取的，轨迹的帧中所包含的行人外观的变化非常有限。所以首先对轨迹数据做了处理：

首先对轨迹进行包括水平翻转、裁剪、旋转和颜色抖动(?)等的随机变换，将轨迹 $T_i$ 重新表示为：
$T_i = \{\{t_{i,j}\}^L_{j=1},\{t_{i,j}^*\}_{j=1,j \ne p}^L\} \tag{1}$
从转换后的轨迹的所有帧中随机选取一帧 $t_{i,p}^*$ 作为正替代
选用全局平均池化获取帧对应的特征向量

参考triplet loss function构建轨迹连续帧学习约束：
$\mathcal{L_f} = \max \lgroup 0, \alpha + D(V_{T_i},V_{t^*_{i,p}}) - D(V_{T_i}, V_{T_{i,n}}) \rgroup \tag{2}$
对于该约束的理解：在本文中对于轨迹的处理方式是从轨迹中随机的选取一帧作为正替代，为保证这一帧和它属于的轨迹相匹配提出了L_f。在保证轨迹中帧的连续性的同时，也保证了它的变化性。

tracklet邻域紧密度学习

在考虑跨相机视角中最近轨迹的搜索时，往往每一个轨迹都对应一个相机标签，但是相机注释不一定都能获得，所以限制了算法的可扩展性。该文在全部的训练数据中为每一个轨迹构建邻域，基于此构建轨迹邻域紧密型约束公式：

$\mathcal{L_n}=-\lambda log \frac{exp(-sD(V_{T_i},V_{K_i})^2)}{\sum_{j=1,j \ne i}^Nexp(-sD(V_{T_i},V_{T_j})^2)} \tag{3}$

在该约束中，仅选用最近的邻域进行合并。该过程中，保存了全局的轨迹模型 $\mathcal{M}$ ，在第 $t$ 中， $V_t$ 的更新公式：

$V_t = (1-\eta)V+\eta V_{t-1}\tag{4}$

对该约束的理解： 这个约束是让相近的轨迹彼此靠近，这个应该是有考虑到不同相机视角中同一身份轨迹之间的联系。

tracklet聚类结构学习

为了获取可靠的聚类结构，构建tracklet的聚类约束为：

$\mathcal{L_c}=-log \frac{exp(V_{c,i}^TV_i/\tau)}{\sum_{j=1}^{N_c}exp(V_{c,j}^TV_i/\tau)}\tag{5}$

提出了新的聚类簇距离度量公式：

$\tilde{D}(V_{c,i},V_{c,j})=D_c(V_{c,i},V_{c,j}) + exp(2D_c(V_{c,i},V_{c,j}) \\ -\frac{1}{N_k}(\sum_{l=1}^{N_k}D_c(V_{c,i},V_{K_{c,l}^i})+\sum_{l=1}^{N_k}D_c(V_{c,j},V_{K_{c,l}^j})))\tag{6}$

对该约束的理解： 在聚类结构学习中，根据新的聚类簇距离度量公式将相近的聚类进行合并，并用 $L_c$ 衡量这次聚类的可靠性（存疑？）

TSSL算法的流程

具体实现细节

采用ResNet-50作为主干网络，在图像数据集中
设置每个轨迹对应 $L = 4$ 帧，视频数据集中，设置每个轨迹对应 $L = 16$ 帧
公式（2）中的 $\alpha$ 设为2
公式（4）中的 $\eta$ 设为0.5
公式（3）中的的 $\lambda$ $= 0.1$ 、 $s = 10$
公式（5）中的 $\tau=0.1$
$\delta=0.05$ ,聚类的 $N_k=4$
最大的训练epoch中前20为第一阶段训练，剩余的5轮为第二阶段训练
使用SGD作为优化器，学习率初始化为0.01，15轮之后以0.1的速度进行衰减

实验结果

在这里插入图片描述

sykai1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
论文阅读-Tracklet self-supervised learning for unsupervised person re-identification2020_AAAI阅读笔记

本文仅是自己学习所记，请谨慎采纳，如有错误不妥之处欢迎各位朋友指正！研究背景现有的无监督行人re-id方法，主要集中于跨域适应和one-shot学习上。虽然这些方法的可扩展性要比监督学习好，但是对相关的标记源域的依靠和每个人都初始化一个已经标记的轨迹限制了它在现实应用中的可扩展性。论文内容算法的整体结构如下图所示：因为不使用行人特征的标签，所以构建了三个自监督学习约束来完成模型训练： tracklet连续帧学习tracklet紧密度学习tracklet聚类结构学习track
复制链接

扫一扫