DyGLIP:跨摄像头多目标跟踪的动态图模型

最新推荐文章于 2024-01-11 11:32:20 发布

Waiting_fade

最新推荐文章于 2024-01-11 11:32:20 发布

阅读量951

点赞数

文章标签：目标跟踪人工智能计算机视觉

原文链接：https://openaccess.thecvf.com/content/CVPR2021/papers/Quach_DyGLIP_A_Dynamic_Graph_Model_With_Link_Prediction_for_Accurate_CVPR_2021_paper.pdf

版权

DyGLIP: A Dynamic Graph Model with Link Prediction for Accurate Multi-Camera Multiple Object Tracking
本文为阅读论文时做的翻译，还没有良好的习惯，随便看看就好

原文链接

CVPR2021DYGLIP

新的MC-MOT framework，对关联的performance 有提升，跟注意力机制有关

本文工作

假设每个单摄像头都用现成的MOT算法,对于未被分配的轨迹，大多的MOT都做不好因为仅仅使用特征向量来进行匹配已知的关联集合。
本文提出动态图的方法
在未分配之前，动态图和新节点的连接是不确定的
$e (i)$ 为物体在不同摄像头的特征参数

自注意力机制在动态图中的应用

结构化注意力层
不仅考虑到嵌入的特征信息，而且也考虑到摄像头的信息

$\left.\mathbf{h}_{v_{i}}^{t}=\underset{l=1}{L} \underset{\text { Concat }}{L}\left[\sum_{v_{j} \in \mathcal{V}^{(t)}} \alpha_{i j}^{l} \operatorname{conv}_{1 \times 1}^{l}\left(\mathbf{e}_{v_{j}}^{t}\right)\right)\right]$
注意力参数
$\alpha_{i j}^{l}=\frac{\exp \left(\sigma\left(\mathbf{W}_{i j}^{T}\left[\operatorname{conv}_{1 \times 1}^{l}\left(\mathbf{e}_{v_{i}}^{t}\right) \| \operatorname{conv}_{1 \times 1}^{l}\left(\mathbf{e}_{v_{j}}^{t}\right)\right]\right)\right)}{\sum_{v_{k} \in \mathcal{V}(t)} \exp \left(\sigma\left(\mathbf{W}_{k j}^{T}\left[\operatorname{conv}_{1 \times 1}^{l}\left(\mathbf{e}_{v_{k}}^{t}\right) \| \operatorname{conv}_{1 \times 1}^{l}\left(\mathbf{e}_{v_{j}}^{t}\right)\right]\right)\right)}$

暂时性注意力层
加入时间信息，然后编解码
$\mathbf{z}_{e}^{(l)}=\operatorname{atth}^{(l)}(\mathbf{Q}, \mathbf{K}, \mathbf{V})=\operatorname{softmax}\left(\frac{\mathbf{Q} \mathbf{K}^{T}}{\sqrt{D_{Z}}}+\mathbf{M}\right) \mathbf{V}$
queries
$Q=XW_Q$
$K=XW_K$
$V=XW_V$