unet 层_【paper阅读笔记】UNet

最新推荐文章于 2023-10-11 23:53:08 发布

weixin_39880623

最新推荐文章于 2023-10-11 23:53:08 发布

阅读量336

点赞数

文章标签： unet 层

本文链接：https://blog.csdn.net/weixin_39880623/article/details/112321687

版权

本文介绍了U-Net网络结构，一种用于解决医学图像分割问题的深度学习模型。U-Net结合了上下文信息和位置信息，通过数据增强和加权损失函数提高分割精度。其网络设计包括编码器和解码器，采用上采样和特征融合策略，有效解决了传统方法的局限性。该模型在2015年ISBI细胞跟踪比赛中的表现突出。

摘要由CSDN通过智能技术生成

全名：《U-Net: Convolutional Networks for Biomedical Image Segmentation》

文章地址：http://www.arxiv.org/pdf/1505.04597.pdf

Github：https://github.com/jakeret/tf_unet

发表年份：2015年

医学领域图像分割标注数据相对不足；
本文的比较对象为Ciresan et al. ^[1]，该文章通过输入以某个像素点为中心的一个patch以获得该像素点的label，但存在两点不足：1）由于需要逐patch地输入来进行预测，因此非常的慢；2）没有解决位置信息和上下文信息之间的trade-off问题，即大patch有上下文信息但是缺少位置信息(max-pooling所致)，小patch有位置信息但是缺少上下文信息；
本文的方法基于FCN^[2]。
采用了Overlap-tile strategy:

即由于边界区域的像素缺乏上下文信息，通过在原图像外围“tile”一圈的做法来补全上下文，举例来说，譬如要补全上图中黄框区域的上下文成蓝框区域，具体的做法是将黄框和蓝框之间右侧和下侧的像素通过镜像拷贝的方式拷贝到左侧和上侧，以补全蓝框。

5. 数据增强策略：通过对原始图像进行弹性形变以获得补充图像，这可以让网络学习弹性形变不变性；

6. 加权Loss：增大对粘连的同类物体之间的“background”像素的loss权重，使得每个物体的分割轮廓是清晰的。

Encoder：左半部分，由两个3x3的卷积层（ReLU）+2x2的max polling层（stride=2）反复组成，每经过一次下采样，通道数翻倍；
Decoder：右半部分，由一个2x2的上采样卷积层（ReLU）+Concatenation（crop^[3]对应的Encoder层的输出feature map然后与Decoder层的上采样结果相加）+2个3x3的卷积层（ReLU）反复构成；
最后一层通过一个1x1卷积将通道数变成期望的类别数。

^Ciresan, D.C., Gambardella, L.M., Giusti, A., Schmidhuber, J.: Deep neural networks segment neuronal membranes in electron microscopy images. In: NIPS. pp. 2852–2860 (2012)
^Long, J., Shelhamer, E., Darrell, T.: Fully convolutional networks for semantic segmentation (2014), arXiv:1411.4038 [cs.CV]
^The cropping is necessary due to the loss of border pixels in every convolution. Why?

关注