Polyp-DDPM: Diffusion-Based Semantic Polyp Synthesis for Enhanced Segmentation

医学分割哇哇哇哇哇哇哇哇哇

已于 2024-06-25 08:52:49 修改

阅读量1.2k

点赞数 21

文章标签：深度学习人工智能计算机视觉

于 2024-06-21 21:54:21 首次发布

本文链接：https://blog.csdn.net/weixin_45622568/article/details/139866124

版权

Polyp- ddpm:基于扩散的语义Polyp合成增强分割

摘要：

本研究介绍了一种基于扩散的方法Polyp-DDPM，该方法用于生成假面条件下息肉的逼真图像，旨在增强胃肠道息肉的分割。我们的方法解决了与医学图像相关的数据限制、高注释成本和隐私问题的挑战。通过对分割掩模(代表异常区域的二进制掩模)的扩散模型进行调节，poly - ddpm在图像质量(实现fr起始距离(FID)得分为78.47，而高于83.79)和分割性能(实现交集比(IoU)为0.7156，而基线模型合成图像低于0.6694，真实数据为0.7067)方面优于最先进的方法。我们的方法生成了一个高质量的、多样化的合成数据集用于训练，从而增强了息肉分割模型与真实图像的可比性，并提供了更大的数据增强能力来改进分割模型。

1 介绍

结直肠癌(Colorectal cancer, CRC)是全球第三常见、第二致命的癌症[1]。结直肠癌通常以结直肠息肉开始，这是该疾病的早期指标。

通过结肠镜检查及早发现并切除这些息肉可预防结直肠癌，降低死亡率。然而，在结肠镜检查中识别小息肉可能很困难，这取决于医生的专业知识和其他挑战，例如息肉在检查过程中看不到或被忽视[2]。

为了加强息肉的检测，研究人员正在利用机器学习来自主识别和强调内镜下的息肉[3]。然而，由于需要广泛和多样化的数据集，这些技术的发展面临着重大挑战，这些数据集对于训练模型实现高精度至关重要。由于异常区域出现的多样性、招募患者的困难、数据标注的高成本以及对患者数据隐私的担忧等原因，医疗行业经常面临此类数据的短缺[4]。

为了缓解数据稀缺问题，探索合成图像作为一种可行的解决方案已经引起了人们的关注[5]。

Thambawita等人[6]开发了一种基于gan的方法，用于使用分割蒙版创建息肉图像，使用两个阶段的过程，包括在1,000张图像的HyperKvasir数据集[7]上进行初始训练，然后进行风格转移以生成合成图像。尽管比其他GAN模型获得了更真实的图像，但他们的SinGAN-Seg模型在多样性和细节准确性方面面临挑战。GAN模型的一个普遍问题是模态崩溃问题。基于扩散的模型的最新进展已经克服了模式崩溃问题，产生了比gan更好的多样化、高质量的图像[8]。Macháček等人[9]使用Kvasir-SEG数据集[10]，引入了一种用于息肉图像和掩模生成的两阶段扩散模型。这个过程包括使用改进的扩散模型生成掩模，然后在这些掩模上调节潜在扩散模型以创建图像。尽管该方法可以有效地生成各种图像，但由于需要两个模型，该方法在训练和推理方面的计算成本很高。

为了应对这些挑战，我们引入了一种新的基于扩散的语义息肉合成方法，polyypddpm，旨在增强我们之前的工作Med-DDPM[11]的息肉分割。这种方法通过掩膜图像的通道级联来调节扩散模型