59_3DCapsule: Extending the Capsule Architecture to Classify 3D Point Clouds 论文笔记

最新推荐文章于 2022-03-06 17:14:01 发布

ltt1825548750

最新推荐文章于 2022-03-06 17:14:01 发布

阅读量551

点赞数 1

分类专栏：三维模型检索文章标签：网络算法机器学习深度学习

本文链接：https://blog.csdn.net/qq_34695780/article/details/111246700

版权

三维模型检索专栏收录该内容

15 篇文章 11 订阅

订阅专栏

3DCapsule: Extending the Capsule Architecture to Classify 3D Point Clouds

三维胶囊：扩展胶囊体系结构以分类三维点云

Yongheng Zhao

CVPR 2019

代码地址：https://github.com/yongheng1991/3D-point-capsule-networks

文献地址：https://www.researchgate.net/publication/328781454_3DCapsule_Extending_the_Capsule_Architecture_to_Classify_3D_Point_Clouds

参考链接：https://blog.csdn.net/qq_26591517/article/details/80038823

https://www.sohu.com/a/335800481_715754

首先，了解3个知识点。

（1）自自编码网络

自编码神经网络是一种无监督学习算法，它使用了反向传播算法，并让目标值等于输入值。

自动编码器(auto encoder) 是神经网络的一种，该网络可以看作由两部分组成：一个编码器函数h = f(x) 和一个生成重构的解码器r = g(h)。传统上，自动编码器被用于降维或特征学习。

（2）动态路由算法

动态路由算法大致可以分为两类：

距离矢量路由算法
链路状态路由算法

（3）胶囊网络

胶囊网络是由胶囊组成的，而不是神经元。胶囊是一组神经元，会学习检测给定区域图像的特定目标，输出一个向量，向量的长度代表目标存在的概率估计，而且对姿态参数定向编码。如果对象有轻微的变换，那么胶囊将输出相同长度但是方向略有不同的向量，因此，胶囊是等变化的。

使用基于约定的动态路由来代替传统CNN中的Max-Pool

胶囊的结构如下表：

右边的就是传统的卷积神经网络。

左边的Eq.2的第1个式子的W是通过训练得到的参数，和神经元类似，只不过从一维变成了二维的。

左边的Eq.2的第1个式子的C是动态路由得到的，不需要训练。（动态路由的思路就是将第I-1层变换后的输出和第I层的输出做点积，点积的结果代表两个向量的相似度。）

左边的Eq.1是一个非线性函数，左边是将长度压缩到0-1之间，长度即概率估计值，右边是将向量转换为一个近似的单位向量。

1、待解决的问题

先前胶囊网络依赖于所呈现的特征图和元素之间的空间关系，然而在三维点云分类中的置换不变性通常会丢失这种关系。

2、创新点

1）设计新的3D点云分类器网络架构 3D Capsule，它是典型使用完全连接分类器的临时替换。

2）设计了一个新层 ComposeCaps，此层代替了空间相关的映射，解决了由置换不变性导致的空间关系丢失问题，学习了一种新的有用的胶囊映射，为胶囊网络所利用。

3、优点

从点云获得的潜在胶囊减轻了通过单个低维向量参数化潜在空间的限制;

点云胶囊网络在重建、局部特征提取、三维物体识别迁移较高

4、缺点

3D Capsules的体系结构增加了额外的复杂性。

5、算法原理

3D Capsule网络如下图所示：

网络首先接受N*3的点云输入，然后经过MLP提取出N*128的特征，接着将特征发送给不同权重的多个独立卷积层，每个特征都被最大池化到1024维，再将这些特征合并起来作为初级点胶囊（Primary Point Capsules），其次通过动态路由（Dynamic Routing）初级点胶囊聚集到潜在胶囊（Latent Capsules）里。以上是胶囊编码器。

胶囊解码器是负责重建潜在特征的点集，赋予潜在胶囊随机2D网格，并应用MLPs生成多个点补丁。---MLPs（单字长定点指令平均执行速度，衡量CPU运算速度的一个指标）。由于动态路由的作用，这些点补丁以形状的不同区域为目标。最后，将所有补丁收集到最终的点云中，并测量到输入的倒角距离，以指导网络找到最佳的重建。

3D Capsules架构