文章目录
1 摘要
由于CNN需要大量的数据进行训练而在生物医学领域通常数据量是很小的。因此,针对生物医学图像分割领域,本文作者提出一种数据增强的策略和一种U-Net网络结构,该结构通过端到端的训练能够使用少量的图像而得到比当时滑动窗口法(普通CNN)更好的效果。并且,该网络非常快,使用普通GPU分割一张512x512的图像能在少于1秒的时间内完成。该网络赢得了ISBI细胞处理挑战2015最好的效果。
2 亮点
2.1 数据增强
由于医学领域的图像数据集比较少,所以怎么能从少量数据集中训练网络结构得到一个好的效果成为一个炙手可热的问题。而本文采用了多种数据增强的手段,通过对图像进行平移、旋转、调整图像灰度值、随机弹性变形等几种方式进行数据增强。
2.2 U-Net网络结构
2.2.1 裁剪
在进行整体分析以前,先分析局部信息——裁剪。从网络总体图中,可以看到灰色箭头左边的图像到右边的图像是由大变小的,如第一行的568x568经过灰色箭头以后变成392x392了,这是有一个裁剪的过程,可以看到灰色箭头左边的图像中间带有虚线框便是需要裁剪的大小。其实从宏观上看,最初输入的图像大小为572x572,而最终的输出为388x388。也就是说图像的输入和输出根本是不匹配的。先放论文中的图: