图像分割论文阅读：PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial Decoder

蓝海渔夫

已于 2024-03-20 05:14:01 修改

阅读量785

点赞数 18

分类专栏：深度学习文章标签：论文阅读

于 2024-03-20 05:13:26 首次发布

本文链接：https://blog.csdn.net/wwimhere/article/details/136860843

版权

深度学习专栏收录该内容

27 篇文章 2 订阅

订阅专栏

文章全名：PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial Decoder and Decoder Consistency Training

这篇论文介绍了一种名为PlutoNet的高效息肉分割网络，旨在减少在内镜检查中被专家忽略的息肉数量，并准确地对检测到的息肉进行分割。

1，本文模型的整体结构：

PlutoNet提出了一种新颖的解码器一致性训练方法，包括一个共享编码器、修改后的局部解码器（结合了局部解码器和全尺寸连接，能够在不同尺度上捕捉显著特征而不冗余）以及辅助解码器（专注于更高层次的相关语义特征）。

通过结合修改后的局部解码器和辅助解码器的损失进行训练，以强制一致性，这有助于改善编码器的表示。

2，编码器

PlutoNet采用了EfficientNet-B0的最后三层编码器。EfficientNet-B0是EfficientNet系列中的一个基础模型，这个模型通过使用神经网络架构搜索（neural architecture search）来设计，特别注重在有限的硬件资源下进行训练。

EfficientNet-B0的核心结构是移动翻转瓶颈卷积（Mobile Inverted Bottleneck Convolution，MBConv）模块，该模块还结合了Squeeze-and-Excitation Network（SENet）的注意力机制。

MBConv模块是EfficientNet-B0的核心，它通过神经网络架构搜索得到。该模块类似于深度分离卷积（depthwise separable convolution），首先进行1x1的逐点卷积，然后根据扩展比例（expand ratio）改变输出通道维度。接下来进行kxk的深度卷积（depthwise convolution），之后可能进行SE模块的压缩与激发操作，最后以1x1的逐点卷积恢复原通道维度。

值得注意的是，MBConv使用的是Swish激活函数。

3，辅助解码器

辅助解码器并非解码器，实际上却是编码器和注意力机制的组合。其目的是提取高层次语义特征。

1）多尺度：辅助解码器使用元素级乘法操作来结合来自编码器的不同层次的特征，有助于模型在不同尺度上捕捉到显著的细节。

2）注意力：辅助解码器利用注意力机制来加权不同特征图的重要性，从而使模型能够更加关注于对分割任务有帮助的特征。

3）辅助解码器仅在训练阶段使用，它不参与模型的推理或测试阶段。

4，Modified Partial Decoder

1）作者去除了最初两层编码器的跳跃连接。因为作者认为编码器的前两层（e1和e2）携带的是低级特征，这些特征在后续层中已经被学习。去除的目的是保持模型轻量化。

2）解码器分支：结合了局部解码器（Partial Decoder）和全尺寸连接（Full-Scale Connections），这种结合允许网络在不同尺度上学习显著特征。

注：本文所谓的局部解码器指的就是移除了早期层跳跃连接的解码器，全尺寸连接指的就是带有跳跃连接的层。其实很简单，就是自己发明了两个词汇让人一开始很困惑。

3）为了应对息肉在长宽上的变化，使用了不对称卷积

4）注意力：在每个解码器层之后，使用挤压激励块对特征图进行加权，以增加更相关特征的表示。

5）一致性训练：Modified Partial Decoder的输出与辅助解码器的输出一起用于一致性训练，通过结合两个解码器的损失来强制一致性，这有助于改善编码器的表示并减少不确定性和假阳性率。

6）解码器模块具体结构如下：

5，实验结果：

蓝海渔夫

关注

18
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
图像分割论文阅读：PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial Decoder

这篇论文介绍了一种名为PlutoNet的高效息肉分割网络，旨在减少在内镜检查中被专家忽略的息肉数量，并准确地对检测到的息肉进行分割。
复制链接

扫一扫