什么是多模态图像融合算法

什么是多模态图像融合算法

参考资料:

《综述:一文详解50多种多模态图像融合方法》

https://arxiv.org/abs/2202.02703

背景:

0、这篇paper里边的两个模态分别是:雷达数据、Camera模态;

1、多模态融合的能用的场景有很多,比如2D/3D的目标检测、语义分割,还有Tracking任务。在这些任务中,重中之中就是模态之间的信息交互融合的工作。

2、

融合的类型:

大多数方法遵循将其分为早期(前)融合、特征融合和后融合三大类的传统融合规则。

现在分类方法:

即强融合和弱融合,以及强融合中的四个小类,即早期(前)融合、深度(特征)融合、后期(后)融合、不对称融合(这个表示两个分支的特征进行相互决策)

这个分类方法相当不错啊:来源《一文读懂自动驾驶多模态传感器融合》

image-20221024104704230

Early Fusion

1、LiDAR这个分支与Image信息的早期信息交互的过程。这种方式在reflectance, voxelized tensor, front-view/ range-view/ BEV,pseudo-point clouds都可以使用

2、数据级别可以不仅仅是图像,也可以是特征图。与传统的早期融合定义相比,文章将相机数据的定义不仅仅局限在image上,也将特征信息纳入其中。有意识的对特征信息进行选择融合

Deep-fusion

LiDAR点图分支和Images分支在经过各自的特征提取器后,得到高维度的特征图,并通过一系列下游模块对两个分支模态进行融合

Late-fusion

LiDAR点云分支和相机图像分支的输出,并通过两种模式的结果进行最终预测。后期融合可以看作是一种利用多模态信息对最终方案进行优化的集成方法

Asymmetry-fusion

而来自其他分支的数据级或功能级信息的方法定义为不对称融合。不对称融合方法至少有一个分支占主导地位,其他分支只是提供辅助信息来完成最后的任务。

Weak-Fusion

利用一种模式中的数据作为监督信号,以指导另一种模式的交互。

一般来说,自动驾驶任务包括了经典:目标检测、语义分割、深度估计和深度预测。

目标检测

2D对象检测通常简单地表示为(x,y,h,w,c),而3D对象检测边界框通常会比2D的标注信息多了深度和方向两个维度的信息,表示为(x,y,z,h,w,l,θ,c)

语义分割

会检测环境中的背景和前景目标,并加以区分,使用语义分割了解物体所在的区域以及区域的细节在自动驾驶任务中也是相当重要的

数据的基本成分(如像素和三维点)聚类到包含特定语义信息的不同区域中去。具体来说,语义分割是指给定一组数据,例如图像像素DI={d1,d2,…,dn}或激光雷达3D点云DL={d1,d2,…,dn},以及一组预定义的候选标签Y={ y1,y2,y3,…,yk},我们使用模型为每个像素或点DI分配k个语义标签并将其放置在一个区域的任务。

文献2:

《多模态特征融合方法总结》

前端融合、中间融合和后端融合

前端融合指的是将多个独立的数据集融合成一个单一的特征向量。然后输入到机器学习分类器中。多模态前端融合方法常常与特征提取方法相结合以剔除冗余信息,如主成分分析(PCA)、最大相关最小冗余算法(mRMR)、自动解码器(Autoencoders)等。

中间融合指的是将不同的模态数据先转化为高维特征表达,再于模型的中间层进行融合。

后端融合指的是将不同模态数据分别训练好的分类器输出打分(决策)进行融合。包括最大值融合(max-fusion)、平均值融合(averaged-fusion)、 贝叶斯规则融合(Bayes’rule based)以及集成学习(ensemble learning)

大值融合(max-fusion)、平均值融合(averaged-fusion)、 贝叶斯规则融合(Bayes’rule based)以及集成学习(ensemble learning)

多模态图像融合是指将来自不同传感器或不同模态的图像信息进行融合,以获得更全面、更准确的图像信息。通过将多个图像源的信息进行融合,可以提高图像的质量、增强图像的细节、减少图像的噪声,并且可以获得更多的信息以支持更多的应用场景。多模态图像融合技术在医学影像、遥感图像、安防监控等领域有着广泛的应用。 多模态图像融合的基本原理是将来自不同传感器或不同模态的图像进行对齐和配准,然后通过一定的融合算法将它们进行融合。常用的融合算法包括加权平均法、小波变换法、局部对比度增强法等。这些算法可以根据不同的应用场景和需求选择合适的融合策略。 多模态图像融合的流程一般包括以下几个步骤: 1. 图像对齐和配准:将来自不同传感器或不同模态的图像进行对齐和配准,使它们具有相同的空间参考。 2. 特征提取:从每个图像中提取出有用的特征信息,例如边缘、纹理等。 3. 融合策略选择:根据应用需求选择合适的融合策略,例如加权平均法、小波变换法等。 4. 融合操作:根据选择的融合策略,将特征信息进行融合,生成融合后的图像。 5. 后处理:对融合后的图像进行后处理,例如去噪、增强等。 通过多模态图像融合技术,可以获得更全面、更准确的图像信息,提高图像的质量和可用性,为各种应用场景提供更好的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值