原论文链接: Capsule for Object Segmentation
Abstract
在过去的几年里卷积神经神经网络在计算机视觉任务中获得了较好的结果,2017年Sabour提出了带有动态路由的胶囊网络,在数字识别和小图像识别上得到了好的结果。胶囊网络的成功在于替代了最大池化为动态路由来保存更多的信息,通过输出胶囊向量重建输入,文中的工作第一次将胶囊网络应用于分割中,扩展了卷积胶囊为局部卷积连接路由并且提出了重卷积胶囊的概念。更进一步,扩展了masked reconstruction去重建正例,称其为SegCaps,不仅获得了较好的效果并且减少了参数,最后将其应用于CT扫描上,并与U-Net进行比较,与基线网络相比,减少了参数并且得到了更好的分割结果。
CNN的缺点
尽管CNN表现出了较好的灵活性, 但是由于CNN中神经元是标量,在网络任何给定层处的神经元对于前一层核内神经元的空间关系都是矛盾的。然而胶囊网络的输入和输出都是向量。
将胶囊网络用于目标检测比较苦难主要包括几个原因,动态路由占用内存较多并且运行时间长,因此文中重写了动态路由方法:首先:子胶囊只能在一个定义好的spatially-local内核中路由到父类中。其次:相同类型的仿射变换矩阵共享参数。为了补偿global的损失,文章中将胶囊网络扩展为使用转置矩阵的重卷积胶囊。 通过提出的convolutional-deconvolutional结构,保留了near-global背景信息。从而减少了参数量,解决了内存负担。
使用转置卷积用于预测向量。
卷积胶囊对不同类型的胶囊采用不同的转换矩阵。