Promoting Single-Modal Optical Flow Network for Diverse Cross-Modal Flow Estimation

AAAI 2022

Background

目前的多模态匹配问题:大多为稀疏匹配,需要明确的变换规则;具体某一种模态的匹配;传统方法效率和鲁棒性存在问题

多模态图像匹配通常被认为是专用任务而不是通用

目前的光流算法有弱监督和强监督,目前的数据集全是合成的,弱监督时通常有亮度一致性假设,平滑约束,cencus变换(将图像像素灰度值编码为二进制),而在这方区域不满足亮度一致性假设

Motivation

Idea

利用这些现在的高精度光流算法到多模态图像匹配中去

将RGB图像转为各种模态的帧

利用现成的光流算法构建自监督框架

Method

利用现有的光流算法,使用Modality promotion framework,然后使用cross mode adapter

Modality Promotion Framework

先使用老师去生成伪标签,然后学生去训练多模态的光流,其中输入帧使用模态增强处理输出任意的模态

计算老师和学生的误差值:

当学生网络是RAFT或者crossRAFT时,使用一个序列损失,其中r=0.8

Composite Cross-modal Augmentation

当训练数据集有更多模态的场景时,在未见过的新模态中估计光流更准确

Cross Modal Adapter

不同模态的图像应该使用不同的特征提取器。首相对两幅图提特征,然后scale到固定的尺度,然后reshape特征维度,计算attention矩阵M,使用计算得到的Ms粗对齐特征,对齐的特征输入到小的自适应生成网络G

其中O是希望得到的自适应矩阵,利用得到的O增强特征的提取

也就是该模块生成1×1的卷积对原特征图进行滤波

Experiment

Teacher--RAFT

student的权重初始化是老师的预训练模型

数据增强是使用Albunebtations

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值