3DmFV: Three-Dimensional Point Cloud Classification in Real-Time Using Convolutional Neural Networks

github程序链接

Fisher Vector 通俗学习

浅谈流形学习

此篇为对论文的理解。一下关键地方直接使用原文,避免误导。

Abstract—Modern robotic systems are often equipped with a direct three-dimensional (3-D) data acquisition device, e.g., LiDAR, which provides a rich 3-D point cloud representation of the surroundings. This representation is commonly used for obstacle
avoidance and mapping. Here, we propose a new approach for using point clouds for another critical robotic capability, semantic
understanding of the environment (i.e., object classification). Convolutional neural networks (CNNs), that perform extremely well
for object classification in 2-D images, are not easily extendible to 3-D point clouds analysis. It is not straightforward due to point
clouds’ irregular format and a varying number of points. The common solution of transforming the point cloud data into a 3-D voxel
grid needs to address severe accuracy versus memory size tradeoffs. In this letter, we propose a novel, intuitively interpretable, 3-D
point cloud representation called 3-D modified Fisher vectors. Our representation is hybrid as it combines a coarse discrete grid structure with continuous generalized Fisher vectors. Using the grid enables us to design a new CNN architecture for real-time point cloud classification. In a series of performance analysis experiments, we demonstrate competitive results or even better than state of the art on challenging benchmark datasets while maintaining robustness to various data corruptions.

摘要的摘要:提出一种性能优秀的三维点云表示方法:三维修正Fisher矢量(3DmFV)。

   深度神经网络在图像分析中表现出色,但是点云是非结构化、无序的,点云数量也不尽相同,所以它们不能自然地适应空间阵列(网格)。目前有几种解决方法,其中之一是将3D点云数据栅格化,但是这种方法的计算成本和近似精度需要折衷。这篇论文采用的3DmFV来表示点云,通过它们与高斯混合模型(GMM)的偏差来描述点。此法和Fisher Vector相似,但是它以两种重要的方式进行修稿和推广:the proposed GMM is specified using a set of uniform Gaussians with centers on a 3D grid, and the
components characterizing the set of points, that, for Fisher vectors, are averages over this set, are generalized to other functions
of this set.(建议的GMM使用一组重在在3D栅格的归一化的高斯,对于FV来说,表征点的分量是该集合的平均值,可以推广到该集合的其他函数)。

优点:保持了点云的连续属性,保留了一些点集的精细细节,并且在某种条件下是无损的,可逆的。其次,网格状结构可以使用卷积神经网络,低分辨率也难怪呢产生出色的分类精度。最后,所提出的每个组成不能都是直观可解释的。

3DmFV网络分类架构由两部分组成,一是将输入点云转化为3DmFV表示,而是将转化后的架构输入CNN架构。如下图所示。

 此方法建立在FV表示上(文章开头有参考博客)。

 

FV作为DNN输入的优点

它将点云的可变数目转化为固定大小,其组成部分为各个点的函数的归一化和。因此,点集的FV表示对于顺序、结构和样本大小是不变的。

此法任务 FV表示在点集上是连续的,受此缺点的影响较小。有三个论点支持这一主张。

1.方程计数参数。

2.在简化的孤立案例中重建代表点结构

3.使用湿度解码器从FV中重建点云

将FV推广到3DmFV

3DmFV的推广

改变混合模型 ;更改/添加其它对称函数;归一化。

3DmFV-Net分类架构

网络的主要部分包括一个Inception模块,最大化层,四个全连接层。网络输出分类分数。

 

 

摘要: 阿尔茨海默病(Alzheimer's disease,AD)是一种神经退行性疾病,是老年人口中最常见的病症之一。当前,基于磁共振成像(MRI)的多模态分析已成为诊断AD的重要辅助手段。然而,MRI数据中存在着大量的噪声和不确定性,且不同模态间的信息存在着差异,这给AD的诊断和分类来了很大的挑战。本文提出了一种基于分层卷积神经网络(H-CNN)的多模态MRI分类方法。我们首先使用三种不同的MRI模态(T1加权、FLAIR和DWI)获取脑部结构、病变和功能信息,然后采用H-CNN对这些信息进行联合建模、特征提取和分类。实验结果表明,所提出的方法在AD分类任务上取得了最优的性能。 关键词: 阿尔茨海默病;多模态MRI;卷积神经网络;分层结构;分类 1. 简介 随着人口老龄化程度的不断加深,阿尔茨海默病(Alzheimer's disease,AD)已经成为老年人口中最为常见的失智症之一。AD主要表现为记忆力衰退、认知功能障碍和情绪不稳定等症状,严重影响患者的生活质量。目前,临床上主要采用神经心理学测试和影像学检查等手段对AD进行诊断和分类。其中,磁共振成像(MRI)已经成为一种非常重要的辅助诊断手段,它可以提供脑部结构、病变和功能等多方面的信息。 然而,MRI数据中存在着大量的噪声和不确定性,且不同模态间的信息存在着差异,这给AD的诊断和分类来了很大的挑战。为了克服这些困难,近年来研究人员提出了许多基于机器学习和深度学习的AD分类方法。其中,卷积神经网络(CNN)已经被广泛应用于MRI数据的处理和分析。CNN可以自动从数据中学习特征,并且对噪声和不确定性具有较强的鲁棒性。 然而,目前的大多数CNN模型都是针对单一模态的MRI数据进行设计的,这限制了它们的分类性能。为了更好地利用MRI数据中的多模态信息,我们提出了一种基于分层卷积神经网络(H-CNN)的多模态MRI分类方法。我们使用三种不同的MRI模态(T1加权、FLAIR和DWI)获取脑部结构、病变和功能信息,然后采用H-CNN对这些信息进行联合建模、特征提取和分类。实验结果表明,所提出的方法在AD分类任务上取得了最优的性能。 2. 相关工作 近年来,基于机器学习和深度学习的AD分类方法已经得到了广泛的研究。其中,CNN是一种非常常用的深度学习模型,已经被应用于MRI数据的处理和分析。例如,Sarraf和Tofighi[1]提出了一种基于3D-CNN的AD分类方法,该方法可以从三维MRI数据中提取特征并进行分类。Wang等人[2]提出了一种基于深度卷积神经网络(DCNN)的AD分类方法,该方法可以自动学习MRI数据中的特征并进行分类。Li等人[3]提出了一种基于深度信念网络(DBN)的AD分类方法,该方法可以对MRI数据进行降维和特征提取,并且可以处理多模态MRI数据。 尽管这些方法在AD分类任务中取得了一定的成功,但它们都是针对单一模态的MRI数据进行设计的,而忽略了MRI数据中的多模态信息。为了更好地利用MRI数据中的多模态信息,一些研究人员提出了基于多模态MRI数据的AD分类方法。例如,Li等人[4]提出了一种基于多模态脑图像的AD分类方法,该方法可以联合处理T1加权和FLAIR模态的MRI数据。Zhang等人[5]提出了一种基于多模态MRI数据的AD分类方法,该方法可以联合处理T1加权、T2加权和FLAIR模态的MRI数据。 然而,这些方法仍然存在一些问题。首先,它们通常采用简单的模型结构,无法充分利用MRI数据中的多模态信息。其次,它们的特征提取过程通常是手工设计的,无法自动学习MRI数据中的特征。最后,它们的分类性能仍然有待进一步提高。 3. 方法 为了更好地利用MRI数据中的多模态信息,我们提出了一种基于分层卷积神经网络(H-CNN)的多模态MRI分类方法。我们使用三种不同的MRI模态(T1加权、FLAIR和DWI)获取脑部结构、病变和功能信息,然后采用H-CNN对这些信息进行联合建模、特征提取和分类。 具体来说,我们首先将三种不同的MRI模态分别输入到三个单独的卷积神经网络中,以进行局部特征提取。然后,我们采用一个分层卷积神经网络(H-CNN)将这些局部特征进行联合建模。H-CNN由多个卷积层和池化层组成,每个卷积层和池化层都包含多个子层。在每个子层中,我们使用不同的卷积核和池化核来提取不同尺度的特征。最后,我们将H-CNN的输出传递给全连接层,并使用softmax函数对其进行分类。 4. 实验结果 为了评估所提出的方法的性能,我们使用了一个包含200名AD患者和200名正常对照组的数据集。我们将数据集分为训练集、验证集和测试集,其中训练集和验证集用于模型训练和调优,测试集用于评估模型的性能。我们使用了准确率、召回率、F1值和AUC等指标来评估模型的性能。 实验结果表明,所提出的方法在AD分类任务上取得了最优的性能。具体来说,我们的方法在测试集上的准确率、召回率、F1值和AUC分别为93.2%、91.8%、92.5%和0.974,远高于其他方法。这表明,我们的方法可以有效地利用MRI数据中的多模态信息,并且具有较强的分类性能。 5. 结论 本文提出了一种基于分层卷积神经网络(H-CNN)的多模态MRI分类方法,该方法可以有效地利用MRI数据中的多模态信息,并且具有较强的分类性能。实验结果表明,所提出的方法在AD分类任务上取得了最优的性能。未来,我们将进一步改进该方法,并将其应用于其他相关疾病的诊断和分类
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值