图像分割UNet系列------Res-UNet详解


    Res-UNet发表于2018年,是UNet非常重要的改进版本之一。当然,Res-UNet同样是应用在医学图像分割领域-----视网膜血管分割。

1、Res-UNet要解决的问题

    作者在文章的简介中就提到了视网膜血管分割任务的主要难点和挑战,这也是Res-UNet重点解决的问题,具体如下所示(直接翻译):

  • 小血管缺失:位于血管末端的小血管有时甚至人眼也难以分辨;
  • 视盘区分割结果不理想:通常视盘区域较亮,对比度相对较低,这增加了视网膜血管分割的难度;
  • 血管拓扑结构难以维系:视网膜血管有类似树状的分叉结构,但当血管太薄而无法检测到时,这样的连续的血管结构就很难保持连接(发生断裂);
  • 光照因素:光照不足或过度曝光,包括相机光源引起的光反射,会降低图像对比度,从而导致视网膜血管边界不清晰。

    综上所述,由于视网膜血管本身成像的限制与成像过程中光源等干扰,都会使视网膜血管的对比度降低,进而造成血管信息丢失或是直接影响血管的拓扑结构。

2、Res-UNet主要网络结构

    从本质上说Res-UNet并不是一个特别难懂的甚至不是特别难以想到的网络结构。在18年之前已经提出了其中经典的Resnet和Attention思想,作者是将这三者做了有机结合。此方法的流程主要所示:
在这里插入图片描述
    以上这张图并不能很好地展现Res-UNet的网络结构,详细的网络结构如下图所示:
在这里插入图片描述
    注意一点:为了解决眼底图像对比度低的现状,作者在进行模型训练以前对图像进行了对比度有限自适应直方图均衡化(CLAHE)操作,为了增加样本数量进行了patch操作。这两个部分的操作其实是值得我们深入思考的。将在下文中提出自己的观点。

2.1 Attention部分

    Attention部分其实操作也相对简单,主要是通过提取具有圆形感兴趣区域(ROI)和深色背景。然后使用圆形模板ROI mask M作为加权注意,如图2所示黄色箭头。利用这种加权注意机制,使模型只关注目标ROI区域,而忽略了不相关的噪声背景。这个操作实质上就是注意机制是通过将模型的最后一层的特征图与注意掩模相乘来实现的。ROI mask实际上是将图像进行二值化的过程。

2.2 skip连接部分

    根据Resnet的思想将skip连接添加到网络中(见图2的灰色实线部分),此操作增加了网络的深度,根据Resnet中的解释,还可以防止过拟合,提高模型的准确度。

3、引发的思考

3.1 网络结构的思考

    Attention部分祛除了ROI区域以外的噪声影响,但是使用CLAHE增强后并没有去除ROI内部的噪声干扰。但是从文章结果来分析,似乎并没有造成较大的影响。
    skip连接部分充分说明了Resnet的强大,当然网上有太多的解释和分析, 本人不在此处细讲。

3.2 CLAHE增强与patch操作

    CLAHE增强操作必然会增加图像的噪声,当然作者应该进行了滤波操作以保障二值化(ROI)的准确性,也保证网络输入部分图像信号的质量。但是有一个问题值得我们思考,增加噪声就一定会使网络性能变差吗?就算是进行滤波或是其他降噪操作,CLAHE增强带来的噪声是不会完全消失的。噪声是不是还会使网络性能产生较好的性能?我在这一刻想到了反向传播,想到了梯度和激活函数,这是个有趣的点。

    原文中的patch操作是无重叠的,最后再拼在一起。实际上无重叠会造成信息的丢失,尤其是上下文信息的丢失,这在一定程度上会影响血管拓扑结构,这也是一个需要关注的地方。

    总之,以上都是自己的愚见,希望各位大神和朋友们激烈交流和讨论。

  • 34
    点赞
  • 214
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 11
    评论
引用\[1\]:Li, H., Xiong, P., An, J., Wang, L.: Pyramid attention network for semantic segmentation. arXiv preprint arXiv:1805.10180 (2018) 。 引用\[2\]:原文地址:RAUNet: Residual Attention U-Net for Semantic Segmentation of Cataract Surgical Instruments Abstract 。 引用\[3\]:解码器通过上采样恢复位置细节。然而,上采样会导致边缘模糊和位置细节丢失。现有的一些工作\[8\]采用跳转连接将低级特征与高级特征连接起来,这有助于补充位置细节。但这是一种幼稚的方法。由于底层特征中缺乏语义信息,因此包含了大量无用的背景信息。该信息可能会干扰目标对象的分割。为了解决这个问题,增强注意模块被设计成捕捉高级语义信息并强调目标特征。 。 问题:请提供attention res-unet原文。 回答:很抱歉,我无法提供attention res-unet的原文。但是根据引用\[1\]和引用\[2\]的信息,可以得知Pyramid attention network和RAUNet是两种用于语义分割的模型。Pyramid attention network是一种基于金字塔注意力机制的网络,用于语义分割任务\[1\]。而RAUNet是一种用于白内障手术器械语义分割的残差注意力U-Net模型\[2\]。根据引用\[3\]的描述,注意力模块被设计用于捕捉高级语义信息并强调目标特征,以解决上采样导致的边缘模糊和位置细节丢失的问题。 #### 引用[.reference_title] - *1* *2* *3* [Residual Attention U-Net 论文笔记](https://blog.csdn.net/charles_zhang_/article/details/124209523)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

gz7seven

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值