【论文阅读】MetaFusion: Infrared and Visible Image Fusion via Meta-Feature Embedding from Object Detection

Prettybritany

于 2024-10-02 11:28:57 发布

阅读量322

点赞数 3

分类专栏：论文阅读图像融合文章标签：人工智能计算机视觉深度学习图像处理论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Prettybritany/article/details/142679679

版权

论文阅读同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

21 篇文章 1 订阅

订阅专栏

MetaFusion: Infrared and Visible Image Fusion via Meta-Feature Embedding from Object Detection（CVPR2023）

现有方法存在问题：

Separate Optimization忽略了对象检测对图像融合的正面影响，因为它孤立地训练每个任务，缺乏任务间的互动与互补。

Cascaded Optimization虽然尝试结合两者，但因直接用高级的对象检测约束低级的图像融合，导致特征不匹配，影响了优化效果。

这两种方法都未能充分利用两个任务之间的相互促进潜力。

本文贡献：

提出了一种元特征嵌入网络（MFE）。思路是，如果M F E 根据IVIF网络能力生成OD特征，那么OD特征自然兼容IVIF网络，并且可以通过模拟元学习来实现优化。

（1）我们探索了IVIF和OD的联合学习框架，并提出了MetaFuison以在这两个任务上获得优异的性能。

（2）元特征嵌入网络旨在生成弥合F和D之间差距的元特征。

（3）随后，引入F和D之间的相互促进学习以提高其性能。

(4)大量的图像融合和目标检测实验验证了该方法的有效性。

研究方法

元特征嵌入

Meta-feature Embedding的核心思想是创建一个中间层，该层能够生成与融合网络兼容的语义特征，从而在两个不同级别的任务——图像融合和对象检测之间建立一座桥梁。具体来说，它包含两个关键组件：元特征生成器（Meta-feature Generator, MFG）和特征转换器（Feature Transformer, FT）。

MFG负责根据红外与可见光图像融合网络（F）产生的特征和对象检测网络（D）提供的语义信息，生成元特征。这意味着MFG能够理解融合网络当前的能力，并据此生产与之相适应的、富含语义的特征表示。这一步骤确保生成的元特征与融合特征在语义上是一致的，便于后续的融合处理。

特征转换器FT则负责将元特征转化为实际可用于图像融合的特征。它通过生成特征桥接（feature bridge），使得元特征能够直接被融合网络所用，以增强图像融合的质量和语义信息的保留。

内更新（Inner Update）: 在此阶段，首先使用元训练集优化IVIF网络（F），以获得更新后的网络F'。然后，使用F'在元测试集上计算融合损失，以优化MFG和FT。目的是使MFG成功生成与F兼容的元特征，从而提高F'生成的融合图像的质量。

外更新（Outer Update）: 在此阶段，使用固定参数的MFG和FT，对IVIF网络F进行训练。F通过元特征的指导进行优化，学习如何提取语义信息以提高融合质量。

相互促进学习

用不断优化的融合网络F生成的高质量融合结果来微调对象检测网络D，反过来，优化后的D又能够提供更优质的语义信息来训练F，形成一个正向反馈循环，共同提升图像融合和对象检测的表现。

网络结构

FFB网络结构：

目标检测网络结构：yolov5

元特征嵌入网络

元特征生成器网络结构：

特征转换器网络结构：

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Prettybritany CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

110万+: 周排名

7万+: 总排名

8万+: 访问

: 等级

872: 积分

397: 粉丝

541: 获赞

21: 评论

512: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文阅读】Equivariant Multi-Modality Image Fusion（CVPR2024）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Text-IF: Leveraging Semantic Text Guidance for Degradation-Aware and Interactive Image Fusion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】A Task-guided, Implicitly-searched and Metainitialized Deep Model for Image Fusion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】MetaFusion: Infrared and Visible Image Fusion via Meta-Feature Embedding from Object Detection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】Multi-modal Gated Mixture of Local-to-Global Experts for Dynamic Image Fusion（ICCV2023）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。