论文解读：3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation

最新推荐文章于 2025-03-06 14:30:38 发布

FireWood_S

最新推荐文章于 2025-03-06 14:30:38 发布

阅读量3.8k

点赞数 2

分类专栏：医学图像分割论文解读分享文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_28144095/article/details/117469113

版权

3D U-Net通过3D卷积改进了传统的U-Net结构，解决了2D切片分割的冗余和效率问题。该模型利用稀疏标注的2D切片实现密集的3D分割，采用加权softmax损失函数，提高训练效率和分割效果，尤其在医学影像分割中表现优异。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

要点

1. 提出了3D U-Net：从稀疏标注的体素图像中学习的立体分割网络。
2. 有两个方案：第一是，在待分割立体图像中标注其中的一些切片，网络从这些标注中学习，再为这个空间提供密集的3D分割；第二是，假设已存在稀疏标注的数据集，直接在这个数据集上训练，然后为新的立体图像进行密集分割。

读引言

研究背景

医学数据分析中立体数据是常见的（CT、MRI）。

为什么要研究

以往slice-by-slice的标注方式是冗余并且低效的，因为相邻切片显示的信息几乎相同，而且逐切片学习出来的2D模型预测效果很差，没有考虑到空间上的互信息。本文提出只要求一部分2D切片生成密集的立体分割的思想，并给出了两种具体方法。

主要内容

3D U-Net改进于先前的U-Net结构，只是输入改为3D体积，并将所有操作替换为3D操作，如3D卷积、3D最大池化和3D上采样。此外，本文中尽量避免了瓶颈操作，并使用批归一化加速收敛。
为什么这里要避免瓶颈，而残差网络等要鼓励使用瓶颈？
因为ResNet的bottleneck是指使用1x1卷积，主要是为了通过降通道数量，来降卷积的参数和计算量，这中间会有信息损失，但影响不大，因为毕竟是负责残差的计算；但是在分割任务中利用池化层获取来多尺度信息，池化操作本身就会损失许多信息，所以反而要在最大池化

最低0.47元/天解锁文章