因为是一篇医疗图像的论文所以看看大概做成什么样子,中了AAAI2020
U-Net
与自然图像不同,在医疗图像上U-Net被应用地较为广泛,具体原因可以参考知乎这篇回答。
网络结构之前讨论过了,如下:
motivation
2个limitations:
1. 卷积和下采样操作都是local的,只能提取局部信息。长距离信息需要通过大量堆叠卷积和下采样操作得到。因为feature map的数量会在线下采样之后double,大量的参数会导致模型不那么efficient。更多的下采样操作会导致更多的空间信息的丢失。
2. 上采样的过程也是相似,然而由于没有考虑到global information,所还原的空间信息是"hard"的。
method
在此基础上,提出了non-local U-Net。
U-Net网络结构作者也给出:
其中input/output block, down-sampling residual block,bottom block,up-sampling residual block分别如下图a,b,c,d:
为了整合全局信息,作者还提出了Global Aggregation Block。其中unfold指的是把 D ∗ H ∗ W ∗ C D*H*W*C D∗H∗W∗C的向量转化为 ( D ∗ H ∗ W ) ∗ C (D*H*W)*C (D∗