【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

yeager415

于 2024-04-18 20:22:52 发布

阅读量473

点赞数 5

文章标签：深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/learnererer/article/details/137933746

版权

文章探讨了一种使用类嵌入分支和融合策略改进的共享编码器，旨在从源图像中提取独特特征。通过两阶段训练和不同损失函数，编码器能适应不同模态并优化特征调整。研究还涉及边缘检测和梯度约束，以及消融实验验证类嵌入的效果。

摘要由CSDN通过智能技术生成

本文提到一些方法使用共享编码器从源图像中提取特征，并且采取手工制作的融合策略。我们的目的是让编码器从源图像中提取出不同的特征，因此我们在编码器中引入了类嵌入分支，对不同模态的特征进行建模，并根据输入模态自适应缩放中间特征。融合策略方面，使用了通道和空间注意力机制对不同模态的特征图进行加权。
训练思路与RFN-NEST相同，两阶段训练，损失不同。
代码不公开
发表自Neurocomputing 2023

作者的想法应该是让编码器学习不同模态图像独特的特征，因此使用了一个类嵌入向量，通过第一阶段的训练，迫使编码器对不同图像建模，使用了一个交叉熵损失，所以这里的训练数据作者应该进行了修改，比如手动标注类别。

在这里插入图片描述

第一阶段训练：
IR和VIS分别提取特征，就是双分支

没有融合层，初始化类嵌入向量
（训练后就与encoder一起固定了）

这两个初始化的向量经过5个全连接层得到Ec,然后注入网络部分的3个CCB
每一层的结果concat起来送入classifier

编码器通过密集连接将调整后的特征进行连接并发送到小分类器头部进行模态分类任务，该任务隐式引导编码器对不同模态进行不同的特征提取。

第二阶段训练就没这个分类器了，直接使用固定的类嵌入和源图像进行训练，并在中间插入融合层。

在这里插入图片描述
Ec根据类执行AdaIN操作：

CCB借助潜在类嵌入EC的类特定差异信息进行归一化处理，便于根据输入图像的类别进行灵活的特征调整，提高编码器部分的表示能力。

CRB这里，把输入送入两个分支，一个进行CDC操作，提取纹理信息，【Pixel difference networks for efficient edge detection】提出的一个边缘检测器

这里下面这个分支只是用conv，称之为content path，两个分支的交互实现了预融合。
融合策略

在这里插入图片描述

第一阶段损失：在这里插入图片描述
第二阶段损失：

sobel 算子

我们认为两个源图像中的梯度同样重要，并计算一个额外的目标来约束融合图像的梯度信息。

在这里插入图片描述

这里参数设置为0.6，也就是更偏向IR一点点。

消融实验：

在这里插入图片描述

作者这里输出了不添加类嵌入向量和添加之后的编码器提取的特征
在这里插入图片描述

典型主观图

在这里插入图片描述

告示牌的白条纹还清晰，就是左上角有种雕刻的感觉（某一篇论文里的表述）

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

本文提到一些方法使用共享编码器从源图像中提取特征，并且采取手工制作的融合策略。我们的目的是让编码器从，因此我们在编码器中引入了类嵌入分支，对不同模态的特征进行建模，并根据输入模态自适应缩放中间特征。融合策略方面，使用了通道和空间注意力机制对不同模态的特征图进行加权。训练思路与RFN-NEST相同，两阶段训练，损失不同。代码不公开发表自Neurocomputing 2023。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。