摘要
基于数据增强和从分利用标注样本,提出了一个网络结构和训练策略。该体系结构由两部分组成:
- 使用contracting path捕获上下文信息
- 使用均衡的expanding path精确定位
网络速度快,在单片GPU上处理一张512x512的图像最多需要一秒。
引言
在视觉识别任务中,深度卷积网络成功的原因在于大的训练数据集和网络结构。卷积网络的典型应用是分类,然而对于像医学图像处理这样的任务,需要精确的进行定位——一个类别标签应该被分给每个像素。同时海量数据集在生物医学上是难以获得的。
![7239122-1a56c27c04278580.png](https://i-blog.csdnimg.cn/blog_migrate/1b97b4462b3ea887e0354de09c5fff42.webp?x-image-process=image/format,png)
图1.U-Net体系结构:蓝条代表特征图,通道数在对应条的顶部,特征图的尺寸在对应条的左下方。白条对应被直接复制的特征图。不同的箭头代表不同的功能。
Ciresan在滑动窗口中设置网络,通过在像素周围提供一个局部区域(patch)来预测每个像素的类标签。该方法有两个缺点&#x