文章标题:SPLATNet: Sparse Lattice Networks for Point Cloud Processing
这是CVPR2018的一篇文章,作者是Hang Su ,他同时也是2015年MVCNN的作者,自然也是很厉害了。这个作者给我的感觉是基础非常扎实,比如之前的MVCNN,最先把多视角机器视觉运用到三维物体感知中来;包括这次用到的bilateral convolution layers (BCLs) 和permutohedra lattice 等文章中最重要的两个概念,都并非原创,而是来源于2015和2016年的会议发布出来的成果,而且网上关于这两个东西的博客不多,看来还是有点冷门的,这就提示我们,想要做出创新,就要先把已有研究成果吃透,特别要能够看到那些被别人忽视的文章。
读这篇文章很容易掉进陷阱,作者给挖了两个坑,会直接影响理解论文的效果,我们在下面的讲解中都会重点提到。
拿到论文先看摘要,它这里啰嗦了半边,其实就是一句话,本文用bilateral convolution layers (BCLs) 堆叠起来构造了一种新的网络结构。
相关研究这里就不说了。
直接看第三章,bilateral convolution layers。这个词来自于文献[22]和[25]:
[22]Learning Sparse High Dimensional Filters:Image Filtering, Dense CRFs and Bilateral Neural Networks . CVPR2016
[25]Permutohedral Lattice CNNs. ICLR 2015
但是笔者去看了这两篇文章,感觉这里其实叫Permutohed