图像融合论文速读:SGFusion: A saliency guided deep-learning framework for pixel-level image fusion

@article{liu2023sgfusion,
title={SGFusion: A saliency guided deep-learning framework for pixel-level image fusion},
author={Liu, Jinyang and Dian, Renwei and Li, Shutao and Liu, Haibo},
journal={Information Fusion},
volume={91},
pages={205–214},
year={2023},
publisher={Elsevier}
}


论文级别:SCI A1 TOP
影响因子:18.6

📖[论文下载地址]
💽[代码下载地址(暂无)]



📖论文解读

作者提出了一种【显著性引导】的【端到端】【通用】【像素级】图像融合框架SGFusion,可用于多模态图像融合(IVIF、医学MRI+PET)和多曝光图像融合任务。
该网络采用双导编码、图像重建解码和显著性检测解码过程,同时从图像中提取不同尺度的特征映射和显著性映射。将显著性检测解码作为融合权值,将图像重构解码的特征合并生成融合图像,可以有效地从源图像中提取有意义的信息,使融合图像更符合视觉感知。

🔑关键词

Pixel-level image fusion 像素级图像融合
Fusion weight 融合权重
Deep learning 深度学习
Saliency detection 显著性检测

💭核心思想

训练的时候是单编码器(提取特征)双解码器(其实就是特征重构解码器和Mask解码器,用于重构源图像和掩膜)

🎖️本文贡献

  • 提出了一种像素级通用图像融合模型,只需要训练一个模型,即可实现多任务图像融合
  • 利用显著性检测来指导图像编码过程,利用显著性检测的特征作为融合权值来实现图像解码过程
  • SOTA

🪅相关背景知识

  • 深度学习
  • 神经网络
  • 图像融合

扩展学习
[什么是图像融合?(一看就通,通俗易懂)]

🪢网络结构

🪢训练部分

对于训练部分,构建【多尺度双导编码融合网络】(multi-scale dual-guided encoding fusion, MDEF)作为整个框架,MDEF主要包括:

  • dual-guided encoding 双指导编码 下图中蓝色模块
  • image reconstruction decoding 图像重构编码 下图中黄色模块
  • saliency detection decoding 显著检测解码 下图中粉色模块
作者提出的网络结构如下所示。

整体结构说白了就是单编码器双解码器,双解码器一个重构源图像,一个生成显著性掩膜

在这里插入图片描述
既然是双解码器,因此就会有两个损失
重构损失Lr和掩膜损失Lm
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
MAE,Mean Absolute Error,平均绝对误差

Binary Cross Entropy(BCE),二值交叉熵
在这里插入图片描述

🪢融合部分

对于融合部分
利用训练部分的结构重构双输入网络,并将网络提取的显著特征作为权重进行图像融合,生成最终的融合结果

作者提出的网络结构如下所示。

在这里插入图片描述

这里特征融合作者选择了加法策略,融合以后就到E‘那个地方了,然后使用特征重构模块生成融合图像
诶?那前面说了半天的D,显著性检测解码哪去了???
问得好
咱们先看原文
在这里插入图片描述

在这里插入图片描述
3.2.1节说了什么?
又是一个好问题,作者想表达的其实就是:
不同类型的源图像对各种融合任务都有限制,因此有必要选择合适的源图像来生成融合权值。此外,权值设计的另一个关键点是选择显著性检测解码的哪一部分生成权值。

其中,显著性检测解码生成的特征有两个部分:多尺度特征和生成的显著性图(权重图)
在这里插入图片描述
经过对比,作者只使用多尺度特征来生成融合层,可以使融合方法兼顾重要的区域信息和环境信息,避免产生伪影

作者选择显著性检测解码的第一层卷积层计算多尺度权值,同时舍弃了不能有效提取显著性信息的权重

📉损失函数

上文已介绍

🔢数据集

测试数据集:

  • TNO
  • DOI:10.1016/j.infrared.2017.02.005

训练数据集:
对于通用的IF模型,作者只使用了一个数据集训练,这个数据集就是EC-SSD

这是一个显著性分割数据集

图像融合数据集链接
[图像融合常用数据集整理]

🎢训练设置

在这里插入图片描述
在这里插入图片描述

🔬实验

📏评价指标

  • EN
  • MI
  • ME-SSIM
  • QABF

扩展学习
[图像融合定量指标分析]

🥅Baseline

  • IVIF
    Densefuse、GTF、fusongan、IFEVIP、U2Fusion

✨✨✨扩展学习✨✨✨
✨✨✨强烈推荐必看博客[图像融合论文baseline及其网络模型]✨✨✨

🔬实验结果

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

更多实验结果及分析可以查看原文:
📖[论文下载地址]

🧷总结体会

单编码器和双解码器,双解码器一个用于重构,一个用于生成mask


🚀传送门

📑图像融合相关论文阅读笔记

📑[(TLGAN)Boosting target-level infrared and visible image fusion with regional information coordination]
📑[ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss via Meta-Learning]
📑[YDTR: Infrared and Visible Image Fusion via Y-Shape Dynamic Transformer]
📑[CS2Fusion: Contrastive learning for Self-Supervised infrared and visible image fusion by estimating feature compensation map]
📑[CrossFuse: A novel cross attention mechanism based infrared and visible image fusion approach]
📑[(DIF-Net)Unsupervised Deep Image Fusion With Structure Tensor Representations]
📑[(MURF: Mutually Reinforcing Multi-Modal Image Registration and Fusion]
📑[(A Deep Learning Framework for Infrared and Visible Image Fusion Without Strict Registration]
📑[(APWNet)Real-time infrared and visible image fusion network using adaptive pixel weighting strategy]
📑[Dif-fusion: Towards high color fidelity in infrared and visible image fusion with diffusion models]
📑[Coconet: Coupled contrastive learning network with multi-level feature ensemble for multi-modality image fusion]
📑[LRRNet: A Novel Representation Learning Guided Fusion Network for Infrared and Visible Images]
📑[(DeFusion)Fusion from decomposition: A self-supervised decomposition approach for image fusion]
📑[ReCoNet: Recurrent Correction Network for Fast and Efficient Multi-modality Image Fusion]
📑[RFN-Nest: An end-to-end resid- ual fusion network for infrared and visible images]
📑[SwinFuse: A Residual Swin Transformer Fusion Network for Infrared and Visible Images]
📑[SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer]
📑[(MFEIF)Learning a Deep Multi-Scale Feature Ensemble and an Edge-Attention Guidance for Image Fusion]
📑[DenseFuse: A fusion approach to infrared and visible images]
📑[DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pair]
📑[GANMcC: A Generative Adversarial Network With Multiclassification Constraints for IVIF]
📑[DIDFuse: Deep Image Decomposition for Infrared and Visible Image Fusion]
📑[IFCNN: A general image fusion framework based on convolutional neural network]
📑[(PMGI) Rethinking the image fusion: A fast unified image fusion network based on proportional maintenance of gradient and intensity]
📑[SDNet: A Versatile Squeeze-and-Decomposition Network for Real-Time Image Fusion]
📑[DDcGAN: A Dual-Discriminator Conditional Generative Adversarial Network for Multi-Resolution Image Fusion]
📑[FusionGAN: A generative adversarial network for infrared and visible image fusion]
📑[PIAFusion: A progressive infrared and visible image fusion network based on illumination aw]
📑[CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion]
📑[U2Fusion: A Unified Unsupervised Image Fusion Network]
📑综述[Visible and Infrared Image Fusion Using Deep Learning]

📚图像融合论文baseline总结

📚[图像融合论文baseline及其网络模型]

📑其他论文

📑[3D目标检测综述:Multi-Modal 3D Object Detection in Autonomous Driving:A Survey]

🎈其他总结

🎈[CVPR2023、ICCV2023论文题目汇总及词频统计]

✨精品文章总结

[图像融合论文及代码整理最全大合集]
[图像融合常用数据集整理]

🌻【如侵权请私信我删除】

如有疑问可联系:420269520@qq.com;
码字不易,【关注,收藏,点赞】一键三连是我持续更新的动力,祝各位早发paper,顺利毕业~

  • 28
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: "Mit-Cheetah-Note"是一种学习辅助工具,旨在提高学生的学习效率和效果。它结合了MIT(麻省理工学院)的学习方法和猎豹速读技术。 首先,MIT-Cheetah-Note采用了麻省理工学院的学习方法。这些方法包括主题导图,问题解决和概念联系等。主题导图是一种可视化的学习工具,帮助学生整理和理解知识点之间的关系。问题解决则鼓励学生通过提出问题来主动思考和深入理解知识。概念联系是通过将新知识与已有知识相结合,加深学生对知识的理解。 其次,这个学习工具还集成了猎豹速读技术。速读是一种训练阅读效率和记忆力的技巧。通过使用猎豹速读技术,学生可以提高阅读速度和理解能力。这对于大量阅读任务的学生来说尤其有用,如备考、论文写作等。 MIT-Cheetah-Note采用了数码笔和智能设备相结合的方式进行学习记录和储存。学生可以使用数码笔在纸上做笔记,并通过智能设备将这些笔记同步到云端。这样一来,学生可以随时随地访问他们的学习记录,从而更好地回顾和复习。 总而言之,MIT-Cheetah-Note是将麻省理工学院的学习方法和猎豹速读技术融入一体的学习辅助工具。它帮助学生提高学习效率和效果,并通过数字化技术方便学生的学习记录和辅助复习。 ### 回答2: Mit-Cheetah-Note 是一种人工智能语音助手,最初由麻省理工学院(MIT)研发。该技术基于深度学习和自然语言处理,在提供智能语音交互的同时,还具备类似于记事本的功能。 Mit-Cheetah-Note 可以用于多个方面,例如记录会议笔记、制定待办事项、管理日程安排等。用户可以通过语音指令来创建笔记,编辑文本内容或者提醒自己日程。Mit-Cheetah-Note 还能理解自然语言,对语音指令做出准确的响应,从而提高用户的工作效率。 与其他语音助手相比,Mit-Cheetah-Note 的特点是其记事本功能。用户可以通过语音输入方式,较快地记录需要记下的信息,而无需手动键入。此外,Mit-Cheetah-Note 还有一个方便的搜索功能,可通过关键词搜索用户之前创建的笔记内容,帮助用户快速找到所需的信息。 Mit-Cheetah-Note 可以应用于多种场景,如商务会议、学术讲座、个人笔记等。它不仅可以减少记笔记的时间和工作量,还可以提高笔记的准确性和完整性。 总之,Mit-Cheetah-Note 是一种集成了语音助手和记事本功能的人工智能技术,使用户能够通过语音指令快速记录信息和管理日程,提高工作效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

图像强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值