RGBT Tracking论文阅读:Efficient RGB-T Tracking via Cross-Modality Distillation(CVPR2023)

文章提出了一种跨模态蒸馏框架,通过教师-学生模型的知识蒸馏方法,旨在解决RGBT算法的复杂融合策略与简洁模型性能之间的矛盾。该框架包括SCFD模块传递特定和公共特征,MPSD模块进行多路径选择融合,以及HFRD模块缓解数据不平衡问题,从而实现高效且精确的跟踪。实验表明,这种方法能提升计算效率,同时保持高跟踪精度。
摘要由CSDN通过智能技术生成

针对问题:现有的RGBT算法采用复杂的融合策略需要大量的参数;但是简洁的RGBT跟踪器在计算上可能高效但是特征提取能力会削弱,性能会退化。

解决方法:提出了一种跨模态蒸馏框架,以达到即高效又不降低精度的目的。

  1. 教师-学生模型,知识蒸馏应用于RGBT跟踪
  2. 从降低模型参数量和计算复杂性入手

RGB-T tracking by modality difference reduction and feature re-selection

Learning discriminative model prediction for tracking.

Distilling Knowledge via Knowledge Review

为了减少大模型和简洁模型的性能差距,提出了一个新的教师-学生的知识蒸馏训练框架。

SCFD:模态共有特征和模态特定特征从教师模型传递到学生模型——增强了单模态特征的表示

MPSD:学生模型可以自适应的组合各种简单融合策略生成的多个融合特征,以更彻底地从多模态数据中探索互补信息

HFRD:缓解目标状态估计阶段数据不平衡的问题,提高对干扰物的辨别能力

达到先进性能,减少了参数量和计算复杂性

限制:对于提高目标状态估计部分的效率没有进行工作

贡献

  • 提出了一个特定-公共特征蒸馏模块以将公共模态信息和模态特定信息从深层双流网络转为浅层双流网络
  • 提出了一个多路选择蒸馏模块以指示一个简单的融合模块通过使用多路径从一个精心设计的融合机制中学习更多准确的多模态信息

在这里插入图片描述

Method

在这里插入图片描述

Teacher and Student Model

  • teacher model

    • 输入:一对RGBT图片对
    • 特征提取:双流网络
    • 复杂的特征融合模块
    • 融合后的特征被送到目标状态估计模块中,获得最终的跟踪结果
  • student model

    • 单流特征提取
    • 几个高效的多模态融合模块
  • 特征提取
    在这里插入图片描述

    • Teacher——两个特征提取器ResNet50
    • Student——一个特征提取器ResNet18
    • 使用block3,4的特征进行回归,使用block4的特征进行分类
  • 多模态特征融合

    • Teacher——采用模态差分补偿(MDC)模块和特征重新选择(FRS)模块进行多模态特征融合

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值