【日常学习】U-net的改进

最新推荐文章于 2025-03-13 17:54:12 发布

mlrw335588

最新推荐文章于 2025-03-13 17:54:12 发布

阅读量1.6w

点赞数 12

分类专栏： U-net 深度学习文章标签： U-net 深度学习

U-net 同时被 2 个专栏收录

1 篇文章

订阅专栏

深度学习

1 篇文章

订阅专栏

【日常学习】U-net的改进

文章地址：基于改进 U-NET 网络的神经分割方法研究

ResNet

ResNet建立的模块如下：

残差网络提出了一个捷径(shortcut)的概念，即跳过一个或多个层，将输入结果直接添加到底层，残差网络可以通过下面的公式1来表示
$H (x) = x + F (x) (1)$
其中 $H (x)$ 为底层的映射， $x$ 为输入结果， $F (x)$ 为网络中的隐藏层输出结果。
残差网络通过将多个卷积层级联的输出与输入相加的方式对图片进行特征提取，减少了训练参数。
在卷积神经网络中，网络层次越深，训练时产生的错误越多，训练时间越长。残差网络的出现在一定程度上解决了这个问题。
与其他网络相比，残差网络结构相对简单，训练参数较少，训练时间较短，解决了在极深度条件下深度卷积神经网络性能退化的问题。

U-net与ResNet结合

改进后的U-NET分为收缩网络以及扩张网络两部分。

收缩网络与U-NET中的收缩网络类似，有所不同的是，对于每一层输出的结果先进行规范化处理，随后通过激活函数进行激活。每一个下采样包含两个3x3的卷积层，一个1x1的“捷径”以及一个2x2的池化层。

扩张网络与 U-NET 中的扩张网络类似，每一次上采样包含两个 3x3的卷积层，一个 1x1 的“捷径”，在每一次上采样之前，需要合并收缩网络与之相对应的结果。与收缩网络相似，扩张网络中每一层输出结果都需要先进性规范化处理，随后通过激活函数进行激活。最后，加入 1x1 的卷积网络确定该特征图所对应的结果。

改进后的 U-NET 网络结构如下图所示。

改进后的U-NET网络结构示意图，与U-NET网络相比，改进后的U-NET加入了残差网络，并且对于每一层输出结果进行规范化处理。红色的箭头表示“捷径”层，绿色的方块表示通过“捷径” 层后获取的结果,灰色方块代表上采样过程中对于边界信息的补充。

加入残差网络后的U-NET网络，层次更加深入，训练参数更多，在一定程度上弥补了 U-NET网络不够深的问题，同时由于残差网络的特性，解决了在极深度条件下深度卷积神经网络性能退化的问题。

捷径层（Shortcut）

我们将该网络结构用下面的公式表示
$y = W_{n+1}K(w_nx) + bx ~~~~~~~~~~~~~~~~~~~~(2)$

这里 $y$ 和 $x$ 表示该网络的输出以及输入， $W_{n+1}$ 表示权值， $K$ 表示激活函数； $b$ 为一个可调节的参数，默认为 1。

一个“捷径”层中可以包含多个卷积层，我们可以将 $W_{n+1}K(w_nx)$ 通过 $F(x,w_i)$ 表示多个卷积层的情况，改进后的公式如(3)所示
$y = F(x,w_i) + bx ~~~~~~~~~~~~~~~~(3)$
引入“捷径”层使得U-NET的网络结构更加深入，同时也避免了训练时间过长，训练参数过多以及过拟合现象的发生。

损失函数（Loss）

损失函数(loss function)是用来评估预测值与参考值(ground truth)之间的不一致程度，损失函数越小，模型的鲁棒性越好。
我们将 $L (X, Y)$ 作为该模型的损失函数， $L (X, Y)$ 如公式(4)所示
L(X,Y)公式
其中 $X$ 表示预测值， $Y$ 表示参考值， $S (X, Y)$ 表示两个模型之间的相似程度， $S (X, Y)$ 表达式如(5)所示。
S(X,Y)公式
$∣ X \cap Y ∣$ 表示两个样本间相交部分或重叠部分， $∣ X ∣ + ∣ Y ∣$ 表示预测值和参考值的总量