Net最早发表在2015的MICCAI上,短短3年,引用量目前已经达到了4070,足以见得其影响力。而后成为大多做医疗影像语义分割任务的baseline,也启发了大量研究者去思考U型语义分割网络。而如今在自然影像理解方面,也有越来越多的语义分割和目标检测SOTA模型开始关注和使用U型结构,比如语义分割Discriminative Feature Network(DFN)(CVPR2018),目标检测Feature Pyramid Networks for Object Detection(FPN)(CVPR 2017)等。
网络结构
本文提出了一个分割网络——Unet,Unet借鉴了FCN网络。UNet的结构,我认为有两个最大的特点,U型结构和skip-connection(如下图):
pic
其网络结构包括两个对称部分:前面一部分网络与普通卷积网络相同,使用了3x3的卷积和池化下采样,能够抓住图像中的上下文信息(也即像素间的关系),encoder下采样4次,一共下采样16倍;后面部分网络则是与前面基本对称,其decoder也相应上采样4次,<