RGBT Tracking论文阅读：Efficient RGB-T Tracking via Cross-Modality Distillation（CVPR2023）

qianxi1234

于 2023-06-02 10:43:20 发布

阅读量1.1k

点赞数 2

分类专栏： RGBT跟踪文章标签：论文阅读人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qianxi1234/article/details/131001292

版权

文章提出了一种跨模态蒸馏框架，通过教师-学生模型的知识蒸馏方法，旨在解决RGBT算法的复杂融合策略与简洁模型性能之间的矛盾。该框架包括SCFD模块传递特定和公共特征，MPSD模块进行多路径选择融合，以及HFRD模块缓解数据不平衡问题，从而实现高效且精确的跟踪。实验表明，这种方法能提升计算效率，同时保持高跟踪精度。

摘要由CSDN通过智能技术生成

针对问题：现有的RGBT算法采用复杂的融合策略需要大量的参数；但是简洁的RGBT跟踪器在计算上可能高效但是特征提取能力会削弱，性能会退化。

解决方法：提出了一种跨模态蒸馏框架，以达到即高效又不降低精度的目的。

教师-学生模型，知识蒸馏应用于RGBT跟踪
从降低模型参数量和计算复杂性入手

RGB-T tracking by modality difference reduction and feature re-selection

Learning discriminative model prediction for tracking.

Distilling Knowledge via Knowledge Review

为了减少大模型和简洁模型的性能差距，提出了一个新的教师-学生的知识蒸馏训练框架。

SCFD：模态共有特征和模态特定特征从教师模型传递到学生模型——增强了单模态特征的表示

MPSD：学生模型可以自适应的组合各种简单融合策略生成的多个融合特征，以更彻底地从多模态数据中探索互补信息

HFRD：缓解目标状态估计阶段数据不平衡的问题，提高对干扰物的辨别能力

达到先进性能，减少了参数量和计算复杂性

限制：对于提高目标状态估计部分的效率没有进行工作

贡献

提出了一个特定-公共特征蒸馏模块以将公共模态信息和模态特定信息从深层双流网络转为浅层双流网络
提出了一个多路选择蒸馏模块以指示一个简单的融合模块通过使用多路径从一个精心设计的融合机制中学习更多准确的多模态信息

在这里插入图片描述

Method

在这里插入图片描述

Teacher and Student Model

teacher model
- 输入：一对RGBT图片对
- 特征提取：双流网络
- 复杂的特征融合模块
- 融合后的特征被送到目标状态估计模块中，获得最终的跟踪结果
student model
- 单流特征提取
- 几个高效的多模态融合模块
特征提取
- Teacher——两个特征提取器ResNet50
- Student——一个特征提取器ResNet18
- 使用block3,4的特征进行回归，使用block4的特征进行分类
多模态特征融合
- Teacher——采用模态差分补偿（MDC）模块和特征重新选择（FRS）模块进行多模态特征融合

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
RGBT Tracking论文阅读：Efficient RGB-T Tracking via Cross-Modality Distillation（CVPR2023）

目前大多数RGB-T跟踪器采用双流结构来提取单峰RGB和热特征，并采用复杂的融合策略来实现多模态特征融合，这需要大量的参数，从而阻碍了其在现实生活中的应用。另一方面，紧凑型RGB-T跟踪器在计算上可能是高效的，但由于特征表示能力的削弱，会遇到不可忽略的性能退化。为了弥补这种情况，提出了一种跨模态蒸馏框架，以弥补紧凑跟踪器和强大跟踪器之间的性能差距。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。