论文全称:《U-Net: Convolutional Networks for Biomedical Image Segmentation》
论文地址:https://arxiv.org/pdf/1505.04597v1.pdf
论文代码:https://github.com/jakeret/tf_unet
目录
提出动机
首先,以往的深度学习模型大部分都是分类模型,但是很多视觉任务,特别是医学影像的处理方面,需要的是语义分割,具体到每一个像素上的分类。
其次,很多任务没有imagenet那样大规模的数据集,收集的成本非常高。
最后,之前的方法太慢了,对于定位和使用图像中的上下文是一个tradeoff,最近很多方法都是利用多层features,本文也不例外。
综述
UNet是基于全卷积网络,可以参考[深度学习]Semantic Segmentation语义分割之FCN(1),UNet的主要思想就是在常规的卷积网络后面添加连续的层,这些层的目的是上采样。上采样提高了output的输出精度,但是为了更准确地定位,所以结合了上游的feature。Unet中一个比较重