作者:禅与计算机程序设计艺术
1.简介
U-Net 是 2015 年提出的一个全卷积神经网络(CNN)架构,它用于图像分割任务。该网络架构通过在两个路径上进行特征抽取并逐层融合它们来实现对图像进行精细化分割。这种结构能够有效地结合全局信息和局部信息,从而达到很好地解决分割中的信息不足的问题。相比于传统的基于区域的分割方法,U-Net 在准确率、小体积和计算量方面都有很大的优势。
U-Net 的设计思想是将输入图像划分为几个互斥且尺寸相同的子区域,然后再利用卷积网络来提取图像的局部特征。这些局部特征被送入不同大小的网络层,最后再由上采样层回到原始大小的空间域,这样就实现了对原始图像的精确分割。
U-Net 有以下几个主要特点:
- 使用反卷积(也称为转置卷积或下采样卷积)来实现特征的上采样。
- 每个连续的池化层(下采样)后面跟着一个反卷积层(上采样),反卷积层恢复到先前的大小,并与先前层的输出相加,形成一个上采样的通道。
- 在同一个层级中,使用多个卷积核对输入图像做卷积,使得特征提取更加丰富。
- 通过跳跃连接来增强特征图之间的相互依赖关系,使得网络能够更好地学习全局信息。
U-Net 的网络结构如下图所示:
上图左侧为正常的卷积网络,右侧为卷积扩张网络(Convolutiona