这篇论文的主要介绍了一种名为SSN(Stair-Shape Network)的网络结构,用于实时结肠镜图像中的息肉分割。
1,模型整体结构
SSN包含四个残差块(Residual Blocks)作为编码器阶段,以及简化的上采样操作作为解码器阶段。它引入双注意力模块(Dual Attention Module, DAM)和多尺度融合模块(Multi-scale Fusion Module, MFM)来增强特征融合。
2,简化的解码器
采用简化的上采样操作(即双线性插值),而不是U-Net中的多阶段上采样和卷积层,从而显著降低了计算成本。
3,DAM模块
1)在编码器和解码器之间的跳跃连接中使用,以补偿由于简化的上采样操作可能导致的特征损失。
2)DAM包含通道注意力和空间注意力,用于细化每个残差块的输出特征。
先做的是通道注意力,然后是空间注意力。
空间注意力分为两个分支,分别使用最大池化和平均池化来处理,这一步感觉像CBAM。
4,MFM模块
1)用于融合不同层次的特征,首先将三个尺度的输出特征进行连接,然后通过一个ConvBlock来融合这三个尺度的特征。
2)应用类似Squeeze-and-Excitation的结构进行更好的特征选择和组合。
5,实验结果: