医学图像分割——U-Net解读与个人笔记

本文详细介绍了U-Net深度学习模型在医疗影像分割任务中的创新设计和优势。U-Net结合了合同路径和对称扩张路径,解决了传统方法的效率和定位精度问题。通过数据增强和加权损失函数,该模型在有限的数据集上表现优秀,特别是在边界区域的分割。评估指标包括warping error、Rand error和IoU,证明了U-Net在分割质量和效率上的优越性。此外,U-Net的结构对大尺寸图像的无缝分割提供了可能,使其成为生物医学图像分析的重要工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近开始尝试医疗影像分割的任务,先从之前的Unet开始阅读,记录一部分笔记以供回顾。

论文地址:http://www.arxiv.org/pdf/1505.04597.pdf

在这里插入图片描述

摘要

作者提出了一个相对当时来说全新的网络,Unet。Unet主要由contracting path(特征提取通路),symmetric expanding path(合成扩张通路)组成,运行速度很快,且远胜于当时最好的方法——基于滑动窗口。在生物医学中应用CNN有很多难点,其中之一便是医学图像数据往往比较稀有。因此,论文也提出了一些新的数据增强的思路。

1.网络结构

图像分割任务其实和图像分类任务有很多相似之处,区别在于图像分割任务需要将每一个像素都分类,而图像分类则只需要将整张图片分类。或者换个说法,图像分割不仅需要分类,还需要定位,定位分类结果的位置。在生物医学领域,大规模的数据集往往是难以获得的,因此Ciresan等人训练了一个基于滑动窗口(sliding-window)的网络,对每一个需要预测的像素,输入其局部的图像信息(patch),然后对改像素进行分类。对输入的图像分割成patch然后输出对应像素的类别可以有效地扩充数据集。

然而,Ciresan等人的方法有两个明显的缺点

  • 分别对每一个像素进行分类,使得在分割整张图片时运行非常缓慢,其中有大量冗余的计算,不同像素间进行分类时计算的特征图不能共享
  • 需要平衡定位和patch的大小,更大的patch输入需要更多的max-pooling层,但这会降低对像素定位的精度,而小的patch则意味着网络或许的信息过于局部,无法纵览全局。

因此,作者借鉴FCN(fully convolutional network)提出了Unet,其中没有使用任何的全连接层,几乎都是卷积层和池化层的搭配。左边部分为contracting path,由连续的卷积层来提取特征,并不断缩小特征图的尺寸,并增加特征图的通道数。右边部分为symmetric expanding path,通过上采样改变输出特征图的尺寸。同时,为了定位(分割 ≈ 分类+定位)由contracting path得到的不同尺度的特征图与上采样得到的对应尺度的特征图做拼接(concat)。
U-Net中的所有 3

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值