图像融合论文阅读:ReFusion:通过元学习的从可学习损失重建中学习图像融合

@article{bai2023refusion,
title={ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss via Meta-Learning},
author={Bai, Haowen and Zhao, Zixiang and Zhang, Jiangshe and Wu, Yichen and Deng, Lilun and Cui, Yukun and Xu, Shuang and Jiang, Baisong},
journal={arXiv preprint arXiv:2312.07943},
year={2023}
}


论文级别:arXiv
影响因子:-

📖[论文下载地址]

💽[代码下载地址:暂无]
作者在摘要中写了The code will be released.但是我目前没有找到,有code的同学可以踢我一脚。



📖论文解读

首先我想说,这篇论文的题目好难翻译呀……也不知道翻译的对不对,好多个“学习”

基于深度学习的图像融合的一个主要挑战就是缺乏明确的ground truth和距离测度。因此需要手动设计损失函数以及相应的超参数,从而限制了模型的灵活性和泛化性。
为了解决这个问题,作者提出了ReFusion的统一的基于元学习的图像融合模型,该模型从重建源图像中学习最佳的融合损失。
ReFsuion由融合模块,损失提议模块(loss proposal module)以及重构模块构成。
采用参数化损失函数,该损失函数由损失建议模块根据特定的融合场景和任务动态调整。
使用元学习策略使重建损失不断细化损失建议模块的参数。自适应更新是通过内部更新、外部更新和融合更新之间的交替来实现的,其中三个组件的训练相互促进。

🔑关键词

图像融合,元学习

💭核心思想

基于元学习的思想,设计了一个可学习的自适应融合损失函数

🪅相关背景知识

  • 深度学习
  • 神经网络
  • 图像融合
  • 元学习

扩展学习
[什么是图像融合?(一看就通,通俗易懂)]
[一文通俗讲解元学习(Meta-Learning)]
[一文入门元学习(Meta-Learning)(附代码)]

🪢网络结构

作者提出的网络结构如下所示。

I a I_a Ia I b I_b Ib I f I_f If分别表示源图像以及融合图像
I ^ a \hat I_a I^a I ^ b \hat I_b I^b分别表示重构的源图像

如下图所示,ReFusion由三个模块构成:
F ( ⋅ ) \mathcal F(·) F()是融合模块
R ( ⋅ ) \mathcal R(·) R()是重构模块
P ( ⋅ ) \mathcal P(·) P()是损失提议模块
其参数分别用 θ F \theta_\mathcal F θF θ R \theta_\mathcal R θR θ P \theta_\mathcal P θP表示

L f \mathcal L_f Lf表示可学习的参数化融合损失
L r \mathcal L_r Lr表示重构损失,该损失不参与融合模块的更新
三个交替的学习阶段分别由下组成:
红色:内部更新采用当前提案融合损失
蓝色:外部更新利用重建损失来衡量内部更新的效果,并优化损失提案模块
绿色:在融合和重建更新阶段,融合模块根据提案的融合损失进行更新,重建模块也相应更新

简单的介绍完了,接下来让我们看看网络结构图。
在这里插入图片描述
和上面说的一样,红绿蓝三个模块交替学习
在这里插入图片描述
可学习的融合损失函数由损失提议模块 P \mathcal P P生成的两个独立输出对构成,每对与源图像维度相同。
这些“对”是根据源图像及其梯度计算的:
{ [ W a , W b ] , [ V a , V b ] } = P ( I a , I b , ∇ I a , ∇ I b ) \{[W_a,W_b], [V_a, V_b]\}=\mathcal P(I_a, I_b, ∇I_a, ∇I_b) {[Wa,Wb],[Va,Vb]}=P(Ia,Ib,Ia,Ib)
其中, W a i j + W b i j = 1 W_a^{ij}+W_b^{ij}=1 Waij+Wbij=1 V a i j + V b i j = 1 V_a^{ij}+V_b^{ij}=1 Vaij+Vbij=1,∇是sobel operator,计算梯度的

扩展学习
sobel operator

可学习的融合损失公式如下:
融合损失=强度损失+参数×梯度损失
在这里插入图片描述
在这里插入图片描述

W a i j W_a^{ij} Waij W b i j W_b^{ij} Wbij指示了损失函数对于每个源图像强度信息的偏好,即强度权重
V a i j V_a^{ij} Vaij V b i j V_b^{ij} Vbij 指示了损失函数对于每个源图像梯度信息的偏好,即梯度权重

重构损失的公式如下:
重构损失=强度损失+参数×梯度损失
在这里插入图片描述

融合训练数据集 { I a f t r , I b f t r } \{I_a^{ftr}, I_b^{ftr}\} {Iaftr,Ibftr}划分为两个子集:
元训练集 { I a m t r , I b m t r } \{I_a^{mtr}, I_b^{mtr}\} {Iamtr,Ibmtr}
元测试集 { I a m t s , I b m t s } \{I_a^{mts}, I_b^{mts}\} {Iamts,Ibmts}

📉损失函数

上节已介绍

🔢数据集

  • MSRS
  • RoadScene

图像融合数据集链接
[图像融合常用数据集整理]

🎢训练设置

我们看这个过程,首先需要元训练集,对应模型总图的①,元测试集,对应②,以及融合训练集对应③。最终的输出是融合图像 I f I_f If
在这里插入图片描述

🎢①内部更新

在内部更新阶段,希望使用提议损失 P \mathcal P P的当前状态定义的融合损失来更新 F \mathcal F F
输入元训练集 { I a m t r , I b m t r } \{I_a^{mtr}, I_b^{mtr}\} {Iamtr,Ibmtr},融合网络 F \mathcal F F通过梯度下降进行单次更新:
在这里插入图片描述
W和V是 P \mathcal P P的当前输出,使用融合损失作为参数。
η F ′ \eta_{F^{\prime}} ηF代表用于更新融合模块的步长
F ′ {\mathcal F^{\prime}} F F \mathcal F F的临时代替,相当于自增自减的一个临时变量
同理,重建模块 R \mathcal R R的更新一样:
在这里插入图片描述

🎢②外部更新

外部更新的主要目标是细化损失建议模块 P \mathcal P P,通俗点来说,就是为了增强由损失函数 L f \mathcal L_f Lf指导的 融合模块 F \mathcal F F 的有效性
在上一步中,内部更新的 F ′ {\mathcal F^{\prime}} F R ′ {\mathcal R^{\prime}} R体现了当前的教学能力(instructional capacity)
在此步骤中,利用元测试集 { I a m t s , I b m t s } \{I_a^{mts}, I_b^{mts}\} {Iamts,Ibmts},基于重建损失 L r \mathcal L_r Lr更新参数 θ P \theta_\mathcal P θP,这里重建损失 L r \mathcal L_r Lr是由 F ′ {\mathcal F^{\prime}} F R ′ {\mathcal R^{\prime}} R计算得到的:
在这里插入图片描述
在这里插入图片描述
更新后的损失建议模块 P \mathcal P P被细化,可以提议效果更好的融合损失函数

🎢③融合及重构更新

使用 F \mathcal F F的当前状态提升 P \mathcal P P,反过来细化后的 P \mathcal P P被进一步用来训练 F \mathcal F F
此步骤输入融合训练数据集 { I a f t r , I b f t r } \{I_a^{ftr}, I_b^{ftr}\} {Iaftr,Ibftr}
通过融合损失 L f \mathcal L_f Lf和重构损失 L r \mathcal L_r Lr来更新 F \mathcal F F R \mathcal R R
在这里插入图片描述

具体算法伪代码为:
在这里插入图片描述

在一个epoch内,嵌套了两个循环
第一个循环内部是:

  • ①内部更新:应用 P \mathcal P P
    • 从元训练集 { I a m t r , I b m t r } \{I_a^{mtr}, I_b^{mtr}\} {Iamtr,Ibmtr}中采样图像对
    • 计算相应的 { I f m t r , I ^ a m t r , I ^ b m t r } \{I_f^{mtr}, \hat I_a^{mtr}, \hat I_b^{mtr}\} {Ifmtr,I^amtr,I^bmtr}
    • 根据公式7和8,计算 θ F ′ \theta_{ \mathcal F^{\prime}} θF以及 θ R ′ \theta_{ \mathcal R^{\prime}} θR
  • ②外部更新:优化 P \mathcal P P
    • 从元测试集 { I a m t s , I b m t s } \{I_a^{mts}, I_b^{mts}\} {Iamts,Ibmts}中采样图像对
    • 计算相应的 { I f m t s , I ^ a m t s , I ^ b m t s } \{I_f^{mts}, \hat I_a^{mts}, \hat I_b^{mts}\} {Ifmts,I^amts,I^bmts}
    • 根据公式8更新 θ p \theta_p θp

第二个循环内部是:

  • 融合及重构更新:优化 F \mathcal F F R \mathcal R R
    • 从融合训练数据集 { I a f t r , I b f t r } \{I_a^{ftr}, I_b^{ftr}\} {Iaftr,Ibftr}采样图像对
    • 计算相应的 { I f f t r , I ^ a f t r , I ^ b f t r } \{I_f^{ftr}, \hat I_a^{ftr}, \hat I_b^{ftr}\} {Ifftr,I^aftr,I^bftr}
    • 根据公式11和12,更新 θ F \theta_\mathcal F θF θ R \theta_\mathcal R θR

然后进行下一个epoch的循环

🔬实验

📏评价指标

  • EN
  • SD
  • SF
  • AG
  • SCD
  • SSIM

扩展学习
[图像融合定量指标分析]

🥅Baseline

  • SDNet、TarDAL、Defusion、MetaFusion、CDDFuse、LRRNet、MURF、DDFM、SegMIF

✨✨✨扩展学习✨✨✨
✨✨✨强烈推荐必看博客[图像融合论文baseline及其网络模型]✨✨✨

🔬实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

更多实验结果及分析可以查看原文:
📖[论文下载地址]

🧷总结体会

这篇论文很复杂…我看的也不是太懂,而且也没有找到代码。不过开阔了眼界,transformer+元学习+图像融合的组合很神奇


🚀传送门

📑图像融合相关论文阅读笔记

📑[YDTR: Infrared and Visible Image Fusion via Y-Shape Dynamic Transformer]
📑[CS2Fusion: Contrastive learning for Self-Supervised infrared and visible image fusion by estimating feature compensation map]
📑[CrossFuse: A novel cross attention mechanism based infrared and visible image fusion approach]
📑[(DIF-Net)Unsupervised Deep Image Fusion With Structure Tensor Representations]
📑[(MURF: Mutually Reinforcing Multi-Modal Image Registration and Fusion]
📑[(A Deep Learning Framework for Infrared and Visible Image Fusion Without Strict Registration]
📑[(APWNet)Real-time infrared and visible image fusion network using adaptive pixel weighting strategy]
📑[Dif-fusion: Towards high color fidelity in infrared and visible image fusion with diffusion models]
📑[Coconet: Coupled contrastive learning network with multi-level feature ensemble for multi-modality image fusion]
📑[LRRNet: A Novel Representation Learning Guided Fusion Network for Infrared and Visible Images]
📑[(DeFusion)Fusion from decomposition: A self-supervised decomposition approach for image fusion]
📑[ReCoNet: Recurrent Correction Network for Fast and Efficient Multi-modality Image Fusion]
📑[RFN-Nest: An end-to-end resid- ual fusion network for infrared and visible images]
📑[SwinFuse: A Residual Swin Transformer Fusion Network for Infrared and Visible Images]
📑[SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer]
📑[(MFEIF)Learning a Deep Multi-Scale Feature Ensemble and an Edge-Attention Guidance for Image Fusion]
📑[DenseFuse: A fusion approach to infrared and visible images]
📑[DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pair]
📑[GANMcC: A Generative Adversarial Network With Multiclassification Constraints for IVIF]
📑[DIDFuse: Deep Image Decomposition for Infrared and Visible Image Fusion]
📑[IFCNN: A general image fusion framework based on convolutional neural network]
📑[(PMGI) Rethinking the image fusion: A fast unified image fusion network based on proportional maintenance of gradient and intensity]
📑[SDNet: A Versatile Squeeze-and-Decomposition Network for Real-Time Image Fusion]
📑[DDcGAN: A Dual-Discriminator Conditional Generative Adversarial Network for Multi-Resolution Image Fusion]
📑[FusionGAN: A generative adversarial network for infrared and visible image fusion]
📑[PIAFusion: A progressive infrared and visible image fusion network based on illumination aw]
📑[CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion]
📑[U2Fusion: A Unified Unsupervised Image Fusion Network]
📑综述[Visible and Infrared Image Fusion Using Deep Learning]

📚图像融合论文baseline总结

📚[图像融合论文baseline及其网络模型]

📑其他论文

📑[3D目标检测综述:Multi-Modal 3D Object Detection in Autonomous Driving:A Survey]

🎈其他总结

🎈[CVPR2023、ICCV2023论文题目汇总及词频统计]

✨精品文章总结

[图像融合论文及代码整理最全大合集]
[图像融合常用数据集整理]

🌻【如侵权请私信我删除】

如有疑问可联系:420269520@qq.com;
码字不易,【关注,收藏,点赞】一键三连是我持续更新的动力,祝各位早发paper,顺利毕业~

  • 31
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

图像强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值