[论文地址] [代码] [MICCAI 21]
Abstract
半监督学习(SSL)使用未标记的数据来弥补标注图像的稀缺性和方法对未见领域的通用性不足,这是医学分割任务中的两个常见问题。在这项工作中,我们提出了POPCORN,一种结合了一致性正则化和伪标签的新方法,用于图像分割。所提出的框架使用高水平的正则化来约束我们的分割模型,使其对具有类似分割的图像使用类似的潜在特征。POPCORN估计一个近似图,从最容易的数据到更难的数据中选择数据,以确保准确的伪标签,并限制确认偏差。应用于多发性硬化症的病变分割,我们的方法与其他最先进的SSL策略相比表现出有竞争力的结果。
Method
本文方法的流程如下:
主要是提出了一个新的伪标签方法以及一个新的正则化方法。
伪标签 一般来说打伪标签主要看的其本身的置信度。本文引入了课程学习的思想,即模型应该从易到难学习样本。从另一个层面理解,不同简单样本之间的特征应该是相似的。给定一张未标注图像,如果其特征与已标注池的特征相似,那么其相对就"比较简单",反之则比较难。这里相当于认为特征相似的样本得到的伪标签会更准确。
举个例子来说,比方有100个已标注的图像,400个未标注的图像。那么在100张已标注的图像训练得到一个模型后,计算所有未标注图像与已标注表征之间的相似度,然后排个序,相似度最高的50个伪标签我们将其视为真值,加进去继续训练;收敛后,再用同样的方法逐步的进行选择。
正则化 至于正则化,则是同一patch的不同augumentation结果应保持一致以及同一区域的不同patch应保持一致,算是比较经典的思路。