最近开始尝试医疗影像分割的任务,先从之前的Unet开始阅读,记录一部分笔记以供回顾。
论文地址:http://www.arxiv.org/pdf/1505.04597.pdf

摘要
作者提出了一个相对当时来说全新的网络,Unet。Unet主要由contracting path(特征提取通路),symmetric expanding path(合成扩张通路)组成,运行速度很快,且远胜于当时最好的方法——基于滑动窗口。在生物医学中应用CNN有很多难点,其中之一便是医学图像数据往往比较稀有。因此,论文也提出了一些新的数据增强的思路。
1.网络结构
图像分割任务其实和图像分类任务有很多相似之处,区别在于图像分割任务需要将每一个像素都分类,而图像分类则只需要将整张图片分类。或者换个说法,图像分割不仅需要分类,还需要定位,定位分类结果的位置。在生物医学领域,大规模的数据集往往是难以获得的,因此Ciresan等人训练了一个基于滑动窗口(sliding-window)的网络,对每一个需要预测的像素,输入其局部的图像信息(patch),然后对改像素进行分类。对输入的图像分割成patch然后输出对应像素的类别可以有效地扩充数据集。
然而,Ciresan等人的方法有两个明显的缺点
- 分别对每一个像素进行分类,使得在分割整张图片时运行非常缓慢,其中有大量冗余的计算,不同像素间进行分类时计算的特征图不能共享
- 需要平衡定位和patch的大小,更大的patch输入需要更多的max-pooling层,但这会降低对像素定位的精度,而小的patch则意味着网络或许的信息过于局部,无法纵览全局。
因此,作者借鉴FCN(fully convolutional network)提出了Unet,其中没有使用任何的全连接层,几乎都是卷积层和池化层的搭配。左边部分为contracting path,由连续的卷积层来提取特征,并不断缩小特征图的尺寸,并增加特征图的通道数。右边部分为symmetric expanding path,通过上采样改变输出特征图的尺寸。同时,为了定位(分割 ≈ 分类+定位)由contracting path得到的不同尺度的特征图与上采样得到的对应尺度的特征图做拼接(concat)。
U-Net中的所有 3

本文详细介绍了U-Net深度学习模型在医疗影像分割任务中的创新设计和优势。U-Net结合了合同路径和对称扩张路径,解决了传统方法的效率和定位精度问题。通过数据增强和加权损失函数,该模型在有限的数据集上表现优秀,特别是在边界区域的分割。评估指标包括warping error、Rand error和IoU,证明了U-Net在分割质量和效率上的优越性。此外,U-Net的结构对大尺寸图像的无缝分割提供了可能,使其成为生物医学图像分析的重要工具。
最低0.47元/天 解锁文章


被折叠的 条评论
为什么被折叠?



