图像分割论文阅读:PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial Decoder

文章全名:PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial Decoder and Decoder Consistency Training

这篇论文介绍了一种名为PlutoNet的高效息肉分割网络,旨在减少在内镜检查中被专家忽略的息肉数量,并准确地对检测到的息肉进行分割。

1,本文模型的整体结构:

PlutoNet提出了一种新颖的解码器一致性训练方法,包括一个共享编码器、修改后的局部解码器(结合了局部解码器和全尺寸连接,能够在不同尺度上捕捉显著特征而不冗余)以及辅助解码器(专注于更高层次的相关语义特征)。

通过结合修改后的局部解码器和辅助解码器的损失进行训练,以强制一致性,这有助于改善编码器的表示。

2,编码器

PlutoNet采用了EfficientNet-B0的最后三层编码器。EfficientNet-B0是EfficientNet系列中的一个基础模型,这个模型通过使用神经网络架构搜索(neural architecture search)来设计,特别注重在有限的硬件资源下进行训练。

EfficientNet-B0的核心结构是移动翻转瓶颈卷积(Mobile Inverted Bottleneck Convolution,MBConv)模块,该模块还结合了Squeeze-and-Excitation Network(SENet)的注意力机制。

MBConv模块是EfficientNet-B0的核心,它通过神经网络架构搜索得到。该模块类似于深度分离卷积(depthwise separable convolution),首先进行1x1的逐点卷积,然后根据扩展比例(expand ratio)改变输出通道维度。接下来进行kxk的深度卷积(depthwise convolution),之后可能进行SE模块的压缩与激发操作,最后以1x1的逐点卷积恢复原通道维度。

值得注意的是,MBConv使用的是Swish激活函数。

3,辅助解码器

辅助解码器并非解码器,实际上却是编码器和注意力机制的组合。其目的是提取高层次语义特征。

1)多尺度:辅助解码器使用元素级乘法操作来结合来自编码器的不同层次的特征,有助于模型在不同尺度上捕捉到显著的细节。

2)注意力:辅助解码器利用注意力机制来加权不同特征图的重要性,从而使模型能够更加关注于对分割任务有帮助的特征。

3)辅助解码器仅在训练阶段使用,它不参与模型的推理或测试阶段。

4,Modified Partial Decoder

1)作者去除了最初两层编码器的跳跃连接。因为作者认为编码器的前两层(e1和e2)携带的是低级特征,这些特征在后续层中已经被学习。去除的目的是保持模型轻量化。

2)解码器分支:结合了局部解码器(Partial Decoder)和全尺寸连接(Full-Scale Connections),这种结合允许网络在不同尺度上学习显著特征。

注:本文所谓的局部解码器指的就是移除了早期层跳跃连接的解码器,全尺寸连接指的就是带有跳跃连接的层。其实很简单,就是自己发明了两个词汇让人一开始很困惑。

3)为了应对息肉在长宽上的变化,使用了不对称卷积

4)注意力:在每个解码器层之后,使用挤压激励块对特征图进行加权,以增加更相关特征的表示。

5)一致性训练:Modified Partial Decoder的输出与辅助解码器的输出一起用于一致性训练,通过结合两个解码器的损失来强制一致性,这有助于改善编码器的表示并减少不确定性和假阳性率。

6)解码器模块具体结构如下

5,实验结果:

  • 18
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

蓝海渔夫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值