图像融合论文速读：SGFusion: A saliency guided deep-learning framework for pixel-level image fusion

最新推荐文章于 2024-07-11 08:29:34 发布

图像强

最新推荐文章于 2024-07-11 08:29:34 发布

阅读量1.2k

点赞数 28

分类专栏：图像融合文章标签：论文阅读图像处理人工智能论文笔记深度学习图像融合

本文链接：https://blog.csdn.net/jiexiang5396/article/details/137126264

版权

图像融合专栏收录该内容

37 篇文章 37 订阅

订阅专栏

@article{liu2023sgfusion,
title={SGFusion: A saliency guided deep-learning framework for pixel-level image fusion},
author={Liu, Jinyang and Dian, Renwei and Li, Shutao and Liu, Haibo},
journal={Information Fusion},
volume={91},
pages={205–214},
year={2023},
publisher={Elsevier}
}

论文级别：SCI A1 TOP

影响因子：18.6

📖[论文下载地址]
💽[代码下载地址（暂无）]

📖论文解读

作者提出了一种【显著性引导】的【端到端】【通用】【像素级】图像融合框架SGFusion，可用于多模态图像融合（IVIF、医学MRI+PET）和多曝光图像融合任务。
该网络采用双导编码、图像重建解码和显著性检测解码过程，同时从图像中提取不同尺度的特征映射和显著性映射。将显著性检测解码作为融合权值，将图像重构解码的特征合并生成融合图像，可以有效地从源图像中提取有意义的信息，使融合图像更符合视觉感知。

🔑关键词

Pixel-level image fusion 像素级图像融合
Fusion weight 融合权重
Deep learning 深度学习
Saliency detection 显著性检测

💭核心思想

训练的时候是单编码器（提取特征）双解码器（其实就是特征重构解码器和Mask解码器，用于重构源图像和掩膜）

🎖️本文贡献

提出了一种像素级通用图像融合模型，只需要训练一个模型，即可实现多任务图像融合
利用显著性检测来指导图像编码过程，利用显著性检测的特征作为融合权值来实现图像解码过程
SOTA

🪅相关背景知识

深度学习
神经网络
图像融合

扩展学习
[什么是图像融合？（一看就通，通俗易懂）]

🪢网络结构

🪢训练部分

对于训练部分，构建【多尺度双导编码融合网络】(multi-scale dual-guided encoding fusion, MDEF)作为整个框架，MDEF主要包括：

dual-guided encoding 双指导编码下图中蓝色模块
image reconstruction decoding 图像重构编码下图中黄色模块
saliency detection decoding 显著检测解码下图中粉色模块

作者提出的网络结构如下所示。

整体结构说白了就是单编码器双解码器，双解码器一个重构源图像，一个生成显著性掩膜

在这里插入图片描述
既然是双解码器，因此就会有两个损失
重构损失Lr和掩膜损失Lm

在这里插入图片描述
MAE，Mean Absolute Error，平均绝对误差

Binary Cross Entropy(BCE)，二值交叉熵
在这里插入图片描述

🪢融合部分

对于融合部分
利用训练部分的结构重构双输入网络，并将网络提取的显著特征作为权重进行图像融合，生成最终的融合结果

作者提出的网络结构如下所示。

在这里插入图片描述

这里特征融合作者选择了加法策略，融合以后就到E‘那个地方了，然后使用特征重构模块生成融合图像
诶？那前面说了半天的D，显著性检测解码哪去了？？？
问得好
咱们先看原文
在这里插入图片描述

在这里插入图片描述
3.2.1节说了什么？
又是一个好问题，作者想表达的其实就是：
不同类型的源图像对各种融合任务都有限制，因此有必要选择合适的源图像来生成融合权值。此外，权值设计的另一个关键点是选择显著性检测解码的哪一部分生成权值。

其中，显著性检测解码生成的特征有两个部分：多尺度特征和生成的显著性图（权重图）
在这里插入图片描述
经过对比，作者只使用多尺度特征来生成融合层，可以使融合方法兼顾重要的区域信息和环境信息，避免产生伪影

作者选择显著性检测解码的第一层卷积层计算多尺度权值，同时舍弃了不能有效提取显著性信息的权重

📉损失函数

上文已介绍

🔢数据集

测试数据集：

TNO
DOI:10.1016/j.infrared.2017.02.005

训练数据集：
对于通用的IF模型，作者只使用了一个数据集训练，这个数据集就是EC-SSD

这是一个显著性分割数据集

图像融合数据集链接
[图像融合常用数据集整理]

🎢训练设置

在这里插入图片描述

🔬实验

📏评价指标

EN
MI
ME-SSIM
QABF

扩展学习
[图像融合定量指标分析]

🥅Baseline

IVIF
Densefuse、GTF、fusongan、IFEVIP、U2Fusion

✨✨✨扩展学习✨✨✨
✨✨✨强烈推荐必看博客[图像融合论文baseline及其网络模型]✨✨✨

🔬实验结果

在这里插入图片描述

更多实验结果及分析可以查看原文：
📖[论文下载地址]

🧷总结体会

单编码器和双解码器，双解码器一个用于重构，一个用于生成mask

🚀传送门

📑图像融合相关论文阅读笔记

🌻【如侵权请私信我删除】

如有疑问可联系：420269520@qq.com;
码字不易，【关注，收藏，点赞】一键三连是我持续更新的动力，祝各位早发paper，顺利毕业~

图像强

关注

28
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
0
评论
图像融合论文速读：SGFusion: A saliency guided deep-learning framework for pixel-level image fusion

该网络采用双导编码、图像重建解码和显著性检测解码过程，同时从图像中提取不同尺度的特征映射和显著性映射。将显著性检测解码作为融合权值，将图像重构解码的特征合并生成融合图像，可以有效地从源图像中提取有意义的信息，使融合图像更符合视觉感知。
复制链接

扫一扫