图像融合论文阅读：RFN-Nest: An end-to-end resid- ual fusion network for infrared and visible images

最新推荐文章于 2025-04-17 17:56:28 发布

图像强

最新推荐文章于 2025-04-17 17:56:28 发布

阅读量1.8k

点赞数 26

分类专栏：图像融合文章标签：论文阅读深度学习图像处理人工智能论文笔记图像融合

本文链接：https://blog.csdn.net/jiexiang5396/article/details/135194083

版权

图像融合专栏收录该内容

40 篇文章

订阅专栏

文章介绍了一种名为RFN-Nest的端到端残差融合网络，用于红外和可见光图像的融合。它采用嵌套连接的自编码器和两阶段训练策略，通过细节保留和特征增强损失优化网络性能。研究了多种损失函数和训练设置，对比了多种基准方法，展示了其在图像融合领域的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

@article{li2021rfn,
title={RFN-Nest: An end-to-end residual fusion network for infrared and visible images},
author={Li, Hui and Wu, Xiao-Jun and Kittler, Josef},
journal={Information Fusion},
volume={73},
pages={72–86},
year={2021},
publisher={Elsevier}
}

论文级别：SCI A1
影响因子：18.6

📖[论文下载地址]
💽[代码下载地址]

📖论文解读

作者提出了一种【基于残差结构】的残差融合网络RFN-Nest，提出了一种【细节保留损失】函数和【特征增强损失】函数来训练网络，训练过程为【两阶段】，第一阶段训练基于【嵌套连接nest connection (Nest) 】的【自编码器】，第二阶段使用所提出的损失函数训练神经网络。

🔑关键词

image fusion, end-to-end network, nest connection, residual network, infrared image, visible image
图像融合，端到端网络，嵌套链接，残差网络，红外图像，可见光图像

💭核心思想

使用残差融合网络RFN融合多尺度深层特征（代替手工融合策略）和基于嵌套连接的解码器实现VIF。
使用RFN使基于自编码器的图像融合网络变成了端到端的融合网络。作者使用两阶段训练策略来训练融合网络（编码器、解码器和RFN），并使用细节保留损失和特征增强损失训练RFN。

参考链接
[什么是图像融合？（一看就通，通俗易懂）]

🪢网络结构

作者提出的网络结构如下所示。“k×k,(in,out)”代表k×k卷积核，输入通道和输出通道。
在这里插入图片描述

🪢RFN网络结构

在这里插入图片描述
$\Phi _{ir}^m$ 和 $\Phi _{vi}^m$ 分别为第m尺度的深度特征图。Conv1和Conv2的输出concat后作为Conv3的输入，Conv6是用于产生初始融合特征的第一个融合层。 $\Phi _{f}^m$ 为融合特征。

🪢解码器网络结构

下图为基于嵌套连接结构的解码器网络结构图，该模型在UNet++的基础上做了简化。
在这里插入图片描述
$\Phi _{f}^m$ 为RFN得到的融合多尺度特征。DCB为有两个卷积层的解码卷积块。
每行均使用跳接连接，和dense block很像。跨层连接，连接着解码器网络中的多尺度深度特征。
该模块输入是使用多尺度特征重构的融合图像。

📝训练策略

先训练AE，然后训练RFN

📝训练AE

在这里插入图片描述

📝训练RFN

在固定AE的情况下，使用适当的损失函数训练RFN

在这里插入图片描述

$L_{detail}$ 和 $L_{feature}$ 分别代表背景细节保存损失函数和目标特征增强损失函数。
在VIF中，大多数背景信息来自于可见光图像。

红外图像包含更多的显著目标特征。

M是多尺度深度特征的个数。本文设置为4.
由于多尺度之间存在着幅度差异，因此 $\omega_1$ 是平衡参数，本文设置为{1，10，100，1000}
$\omega_{vi}$ 和 $\omega_{ir}$ 控制着红外特征和可见光特征对融合特征图的影响程度，即权重系数。

📉损失函数

见上节。

🔢数据集

训练
- 一阶段 MS-COCO，灰度图，256×256
- 二阶段 KAIST
测试
- TNO, VOT2020-RGBT

图像融合数据集链接
[图像融合常用数据集整理]

🎢训练设置

🔬实验

📏评价指标

EN
SD
MI
NABF
SCD
MS-SSIM

参考资料
✨✨✨强烈推荐必看博客 [图像融合定量指标分析]

🥅Baseline

DCHWT、GTF、ConvSR、VGGML、DenseFuse、Fusiongan、IFCNN、NESTFuse、PMGI、DDCGAN和U2Fusion

参考资料
[图像融合论文baseline及其网络模型]

🔬实验结果

从下图可以看出 $\omega_{vi}$ 和 $\omega_{ir}$ 大小对融合结果的影响。
在这里插入图片描述

在这里插入图片描述

更多实验结果及分析可以查看原文：
📖[论文下载地址]
💽[代码下载地址]

🚀传送门

如有疑问可联系：420269520@qq.com;
码字不易，【关注，收藏，点赞】一键三连是我持续更新的动力，祝各位早发paper，顺利毕业~