DGMIL:分布引导的WSI分类多实例学习

DGMIL: Distribution Guided Multiple Instance Learning for Whole Slide Image Classification

摘要

背景
多实例学习(MIL)被广泛用于组织病理学全玻片图像(WSI)的分析。然而,现有的MIL方法并没有明确地对数据分布进行建模,相反,它们只通过训练分类器来有区别地学习袋级或实例级的决策边界。

本文方法
一个用于WSI分类和正patch定位的特征分布引导的深度MIL框架
揭示了组织病理学图像数据的固有特征分布可以作为非常有效的指导,例如分类
提出了一种基于聚类条件的特征分布建模方法和一种基于伪标签的迭代特征空间细化策略,以便在最终的特征空间中可以容易地分离正实例和负实例
代码链接

本文方法

bag:是指同一张图像的patch集合(不重叠),标签为分类标签和是否为W(从W中提取的patch),每一个patch为实例
阴性bag中所有实例的标签都是阴性的,而阳性bag中至少有一个阳性实例,但哪些是阴性的是未知的

肿瘤组织和正常组织之间的细胞形态存在显著差异,因此,如果能够找到合适的潜伏空间,它们在特征空间中的分布也应该显著不同。在此基础上,我们的目标是对特征空间进行适当的建模,使负实例和正实例在特征空间中容易分离。由于我们的方法是基于实例的特征,因此我们在本文后面提到的实例都是指它们的特征向量。

在这里插入图片描述
图1说明了我们提出的DGMIL的总体框架。具体来说,我们使用mask的自动编码器来执行自监督学习(MAE),以训练编码器将所有实例映射到初始潜在特征空间,该空间将被迭代细化。

在推理过程中,我们将WSI中的测试实例映射到细化的潜在特征空间,并计算其实例级分类的正分数。对于Bag级分类,我们只使用简单的平均池化方法来聚合bag中所有实例的正分数。由于训练和推理都是基于每个独立的实例(即不使用幻灯片中的位置信息),因此我们的方法具有排列不变性。

Cluster-Conditioned Feature Distribution Modeling

我们提出了一种基于K-均值聚类和马氏距离的特征分布建模方法。具体来说,我们首先使用K-means算法将训练集中负WSI的所有实例聚类为M个聚类,其中每个聚类表示为Cm。接下来,我们使用训练集中负滑动和正滑动的所有实例的Mahalanobis距离计算正得分si,j

在这里插入图片描述

Pseudo Label-Based Feature Space Refinement

基于MAE的初始特征空间的直接使用并不能很好地对正实例和负实例的分布建模,因为MAE的训练是完全自我监督的,并且没有利用袋级监督。

因此,我们进一步提出了一种基于伪标签的特征空间细化策略来对其进行细化。

这种特征空间细化策略是一个迭代过程。在每次迭代中,我们首先使用K-means算法对训练集中负面WSI中的所有实例进行聚类,并计算正面和负面WSI中所有实例的正分数。正WSI中具有最高正得分的实例的比例和负WSI中具有最低正得分的例子的比例被称为极端实例,并且它们分别被分配伪标签1和0。利用这些极端实例及其伪标签,我们以监督的方式训练了一个简单的二元分类器,该分类器由一个FC层线性投影头和一个FC级分类头组成。最后,我们利用线性投影头将当前实例特征重新映射到新的特征空间中,以实现特征空间的细化。上述特征空间细化过程进行迭代,直到收敛。

实验结果

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
利用多实例学习Multiple Instance Learning, MIL)对WSIWhole Slide Imaging)图像进行分割的一般步骤如下: 1. 数据准备: - 获取WSI图像数据集,其中每个WSI图像可能包含多个区域,每个区域可能包含多个实例(例如细胞)。 - 对每个WSI图像,标注出感兴趣区域(Region of Interest, ROI)以及相应的实例标签。 2. 特征提取: - 针对每个ROI,提取特征来表示该区域的视觉信息。常用的特征包括颜色直方图、纹理特征、形状特征等。 3. 实例级别标签生成: - 对于每个ROI,根据其中的实例标签生成一个实例级别的标签。有多种方法可用,例如:包含正样本的ROI标记为正例,不包含正样本但包含负样本的ROI标记为不确定例,不包含任何样本的ROI标记为负例。 4. 多实例学习模型训练: - 使用MIL算法进行模型训练。MIL是一种弱监督学习算法,其中每个训练样本都由一个或多个实例组成,并且样本级别的标签只有正例和负例。 - 常用的MIL算法包括经典的MIL算法、MIL with Multiple Instance Representation (MIL-MIR)等。 5. 分割预测: - 对于新的WSI图像,首先对其进行分割,得到多个ROI。 - 对于每个ROI,提取特征,并使用训练好的MIL模型进行预测。根据预测结果,可以得到每个ROI的实例级别的标签。 需要注意的是,WSI图像的分割是一个复杂任务,常常需要使用深度学习等方法,并结合大量的标注数据和计算资源来训练和优化模型。同时,还需要根据具体应场景进行一些调整和改进,以获得更好的分割效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小杨小杨1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值