UNet 系列：做医学图像分割的任何人，都必须要会使用 nnU-Net_nnunet和unet区别(2)

最新推荐文章于 2025-03-17 21:29:53 发布

2401_84185471

最新推荐文章于 2025-03-17 21:29:53 发布

阅读量847

点赞数 18

分类专栏：程序员文章标签：大数据面试学习

本文链接：https://blog.csdn.net/2401_84185471/article/details/138678229

版权

程序员专栏收录该内容

112 篇文章

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

UNet++：多层级和多尺度的密集链接

UNet：

UNet++：

UNet和UNet++ 类似飞机和飞机升级版。

都是用来飞行，能带我们去不同的地方。但升级版飞机注重在对原来飞机的改良上，帮助它更好地完成任务。

UNet就像第一代飞机，它的构造很简单，包括下降路径（encoder）和上升路径（decoder），它们尽可能地提取图像信息和预测图像类别。

但是这第一代飞机有局限性。比如说，它只能够做一种类型的飞行任务，不能多任务并行，而且飞行路径不能及时地进行优化调整。

然后，人们发明了UNet++，就像升级版的飞机。它不仅有下降路径和上升路径，还增加了跳跃链接和深度监控。跳跃链接就像是告诉飞行员的不同时期的飞行状况，以便更好地调整飞机路径;深度监控则是增加了飞行途中的多个监控点，可以及时地根据飞行状况进行路径调整。

也就是说，UNet++ 创新性地将解码器（decoder）的不同阶段和编码器（encoder）的各个阶段相互连起来，改进了信息流动的方式，让飞机飞行更加灵活，可控且高效。

再比如，原来每个人只能收到前面一个人的信息，那最前面和最后面距离很远，类似年轻人和老年人之间有代沟。

这样的结构可以有效地缓解两个主要问题：一是语义分割中的大对象和小对象的偏好问题；二是深度监督所带来的深层网络训练难的问题。

nnUNet

集成模型

通常的分割模型都是针对某一特定任务（如心脏分割）进行研究的，需要特定的网络架构设计以及训练方法的设定，它只能解决特定问题而无法解决一系列问题。

而 nnUNet 是一个适应多种分割任务的算法。

一个自适应任何新数据集的医学影像分割框架，该框架能根据给定数据集的属性自动调整所有超参数，整个过程无需人工干预。

具体实现方式：

nnUNet 由 2DUNet、3DUNet、U-Net Cascade 组成。

2D UNet：处理 2D 图像
3DUNet：适合处理3D小尺寸物体的分割。

实际3D训练，因为GPU内存量的限制，只能在切成图像块（patches）训练。

小结构（例如脑肿瘤，海马和前列腺）适合切块，但是像肝这种大结构，切了之后就会损失很多上下文信息。

U-Net Cascade：解决3D U-Net在具有大图像尺寸的数据集上的实际缺陷。

nnUNet 对 UNet网络架构的两个小改动，修改了激活函数和归一化的方法。

激活函数：用 leaky ReLU 而不是 ReLU
归一化方法：使用 instance normalization 代替了更流行的 batch normalization

ReLUs：当输入的信号小于0时，ReLU函数的输出就是0；当输入的信号大于0时，ReLU函数的输出就直接是输入的信号。比如，如果我们给ReLU函数输入-5，那么输出就是0；如果我们输入5，那么输出就是5。
Leaky ReLU: 它是ReLU的一个改进版本。在输入信号小于0时，Leaky ReLU函数的输出不再是0，而是输入的信号乘以一个很小的常数，比如0.01。比如，如果我们给Leaky ReLU函数输入-5，那么输出就是-5乘以0.01等于-0.05；如果我们输入5，那么输出就是5。
ReLUs和Leaky ReLU的区别：想象你有一个可以调亮调暗的手电筒，你可以把电筒调暗到最低，但是它仍然会发出一点点微弱的光。这就像Leaky ReLU，即使输入的信号是负的，输出也不会完全是0。而ReLUs就像一个开关，当你关闭它时，它就完全不会发出光。当你打开它时，它会发出与你给它的电力相等的光。
不完全为0的好处：因为其将所有的输入负数变为0，在训练中可能很脆弱，很容易导致神经元失活，使其不会在任何数据点上再次激活。对于ReLu中(x<0)的激活，此时梯度为0，因此在下降过程中权重不会被调整。
Batch Normalization (BN)：假设我们正在烘焙一批饼干，我们要求所有饼干的大小和烘焙时间都一样。为了达到这个目标，我们需要测量一批饼干的平均大小和烘焙时间，然后根据这个标准来制作每一个饼干。这样我们就可以得到一批相似的饼干。这就像BN，它基于一批样本的平均值和标准差来对每一个样本进行调整。
Instance Normalization (IN)：但是，如果我们想要每一块饼干都有其特有的风味和烹饪方式，那么我们每做一块饼干，都会根据这一块饼干的特性来调整我们的烘焙方式。这就是像IN，它不是参考其他的样本，而是只基于每个单独样本的特性来进行调整。

因此，BN和IN的主要区别在于，BN是对所有样本进行整体标准化，而IN则是对每个样本单独进行标准化。

除了对自适应预处理，还有训练方案和推理的全面设计。