在看了分类网络后,稍稍打算研究一波分割,就从U-Net开始啦。
15年的文章《U-Net: Convolutional Networks for Biomedical Image Segmentation》提出基于少量数据进行的训练的网络模型,不仅网络运行速度很快,也取得了不错的分割精度。在GPU上,512x512图像的分割只需要不到一秒钟的时间。同时该网络在2015年ISBI细胞跟踪挑战赛中以较大优势胜出。
摆上一张网络构架大家来欣赏一下吧。
是不是网络命名的原因呼之欲出,没错就是因为网络构建图想一个U型,所以叫U-Net(如此简单粗暴)
首先讲讲U-Net分割方式和传统的滑动窗口分割方式的区别和优点吧。
基于滑动窗的神经网络:以像素为单位对图片进行分类。[a patch —> net —> a pixel for pixels in an image]。
缺点:
1.需要对每个patch各训练一次,计算量大,冗余性高。
2.周围像素提供信息不确定性高。(以像素为单位,对于窗体选择有较大的不确定性。size过大,反而会导致局部细节的丢失,并需要用到更多的池化层去显现环境信息,却降低了精度。size较小,只允许网络看到少量context。)
所以U-Net的不同就体现出来啦,相较于传统思路,U-Net以图片整体进行图片分类分割,通过下采样和上采样的网络结构,用下采样展现环境信息,上采样结合下采样的信息和上采样的输入信息还原细节&#