U-Net网络模型学习总结
网络模型使用背景
U-Net网络模型是用于图像分割性能较好的一种模型。深度学习擅长解决分类问题,利用深度学习的这一特点进行图像分割,其实质是对图像中的每一像素点进行分类。最终将不同类别的点利用不同的通道标出,可以达到对目标区域中的特征信息分类标出的效果。这就是全卷积网络的主要思想。然而伴随着这种分类方法的还有其特定的缺陷。缺陷一是由于要针对每张图像中的每个像素点进行分类,在形成极大计算量的同时也会因为大量重复的特征提取过程造成很多冗余。最终就会导致整个网络在训练的过程中收敛的速度出奇的慢。缺陷二是有关分割的准确性的选择,在样本数量多的时候考虑大量的池化操作来降低特征区域的分割识别效果,减小识别过程中对非特征区域错误分类的效果。一般会采用优化分类方法以及考虑特征区域前后的像素值的方法改进整个网络模型。
网络模型结构
主要分为上采样和下采样的部分。下采样主要利用连续的卷积池化层提取图像中的特征信息,并逐步将特征信息映射至高维,在整个网络的最高维是整个图像中丰富的特征信息,与FCN不同,U-Net模型并没有直接将其池化并直接上采样至与原图大小一致的输出图像,而是通过反卷积,将高维特征再次向低维映射,映射的过程中为了增强分割的精度,会将同维度下收缩网络中与其维度相同的图像进行融合,由于在融合的过程中维度会变成原维度的2倍,此时需要再次卷积,保证处理过后的维度与融合操作之前的维度相同以便于进行再一次的反卷积后能够和同维度下的图像进行二次融合、一直到最终能够与原图像的维度相同时输出图像。
在这种网络模型的训练中,能够满足在较小的数据集能够提取出较为精确的分割结果。