点云深度学习系列三: SPLATNet: Sparse Lattice Networks for Point Cloud Processing

1. 概念引入

permutohedra  lattice 

(原文:Fast high-dimensional filtering using the permutohedral lattice

下述文字参考了:https://blog.csdn.net/xuanwu_yan/article/details/7962508

一个d维的permutohedral lattice是d+1维空间子平面分割,此超平面法向量为

所以我们有

什么是分割?一般认为分割的格子(lattice)是同样形状,一个平面能够被相同形状的格子没有缝隙,没有重叠的布满,那么格子就是空间的分割。

作者使用了单形进行分割。单形顶点在d+1维空间坐标我们不得而知,作者重新定义了基向量(并不完全准确,因为之间线性相关),于是此子平面上单形顶点的坐标直接满足在平面上的要求,即

 

当d=3时,单形顶点在原点,单形的边长为1,格子如下图所示。

单形的顶点坐标为整数,并且一个点的坐标各项模d+1=3有相同余项k,我们称这个顶点为余k点。这里对上面的基向量稍微做一下解释,假设在三维空间中,有子空间

,有

在xoy平面上,有三个点

这个点经过映射变换,就对应了上图中的橙色区域,坐标为

也就是说,下图右侧x轴原点y轴夹的右上部分区域,是下图左侧分割空间坐标映射变换

bilateral convolution layer(BCL)

(原文:

1.Learning Sparse High Dimensional Filters:Image Filtering, Dense CRFs and Bilateral Neural Networks . CVPR2016

2. Permutohedral Lattice CNNs.  ICLR 2015 )

 

BCL平滑地将输入点映射到稀疏的格子上,在稀疏的点阵上执行卷积,然后将过滤后的信号平滑地插入到原始的输入点上。主要分为: Splat、Convolve、Slice。

Splat: 通过质心插值,将输入特征F投影到由晶格特征L。格子单体的大小或网格点之间的空间通过缩放格子特征ΔL来控制,其中Δ是缩放矩阵的对角线。

Convolve: 投影到dl维网格上,BCL使用可学习的滤波器内核执行dl维卷积。就像在标准CNN一样,BCL在dl维空间中容易指定滤波器邻域。

Slice: 通过质心插值将滤波后的信号映射回输入点。

2. 主要框架

SPLATNet3D:输入点云首先通过一个1*1的卷积层,之后采用不同尺度的BCL层(采用了和CNN一样的思想,格子变的越来越大,感受野也更加大,提取的特征越来高层),之后将这些BCL层合并,通过两个1*1的CONV层得到每个点的预测。

对于分类问题,采用global pooling处理

 

SPLATNet2D-3D:

CNN1: 首先采用2D分割的CNN,本文采用的Deeplab

BCL2D-3D: 采用下图的BCL只包含(splat,slice)将图像像素投影到点云

2D-3D Fusion: 将投影到3D空间的特征和SPLATNet3D对点云处理后得到的特征融合,通过一系列的1*1的卷积层得到了每个点的概率

BCL3D-2D:对于图像的分类问题我们需要将3D特征投影到2D图像,采用BCL2D-3D的逆操作完成

CNN2:将输入图像,CNN1的输出和BCL3D-2D放到一个2DCNN处理

3. 论文意义

将图像和点云结合处理,相互约束,正如PointCNN提出方向一样。

对于2D图像,利用3D特征有助于在多个视点上进行一致的预测。

对于3D点云,合并2D-CNN,有助于利用2D-CNN是在高分辨率图像上计算强大的特点。

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值