U-Net（2015）论文笔记_unet 2015 论文-CSDN博客

本文链接：https://blog.csdn.net/qq_40632955/article/details/126015208

U-Net: Convolutional Networks for Biomedical Image Segmentation

U-Net: 用于生物医学图像分割的卷积网络

创新：UNet模型是医学图像分割的奠基石，对于图像的细节，结合了许多浅层的信息，细节捕捉很好。像医学图像分割浅层细节很关键。但是也存在许多特征冗余，导致卷积运算量大。
行文：
- 论文在介绍自己方法之前，引入别人应对目前问题的解决方法，以及该方法的有效性，但转而指出该方法的缺点，进一步引入自己的方法；
- 虽然自己的方法是在FCN的基础上修改和扩展的，但是论文在介绍FCN方法的之后，强调了自己的不同，以及自己的模型的优势，能很好高效应对当前问题。

在这里插入图片描述

Left side ： a contracting path to capture context
Right side：a symmetric expanding path that enables precise localization
收缩路径使用卷积网络的典型架构，在每次下采样时，通道数加倍；扩展路径中的每个步骤都包括对特征图进行上采样，在每次上采样时，通道数量减半，与来自收缩路径的相应裁剪的特征图的串联；在最后一层，使用1x1卷积将每个64分量特征向量映射到所需的类数；该网络总共有23个卷积层；采用无 padding 的 Conv，空间分辨率会越卷越小
卷积使用的是padding=0，所以会导致，每次卷积后，图像分辨率会下降。
- 因为padding=0，边界预测误差比较大，不利于过大图像切分预测最后拼接。使用边界镜像填充，可以做到无缝拼接。
- 输入图像和预测图的尺寸不一样，输入图像多出的尺寸是镜像扩充的。
- 对应论文的Overlap-tile策略

带权重的损失函数，权重包括，目标边界和目标类像素的频率。
- $a_k(x)$ 是特征图的 $k - t h$ 通道像素点 $x$ 的激活值
- $K$ 是类别数

在这里插入图片描述

如果像素离边界比较近，那么 $d_{1}\left ( x\right )$ 和 $d_{2}\left ( x\right )$ 小，w(x)比较大；如果像素离边界比较远，那么 $d_{1}\left ( x\right )d$ 和 $d_{2}\left ( x\right )$ 大，w(x)比较小，以此来达到加大边界权重的效果

the EM segmentation challenge（电子显微镜场景）
- 30 images (512x512 pixels)，评价指标，warping error、Rand error、pixel error。
a cell segmentation task in light microscopic images（光学显微镜场景）
- PhC-U373 数据集，35 partially annotated training images，评价指标 IoU
- DIC-HeLa 数据集，20 partially annotated training images，评价指标 IoU