作者信息
Zongwei Zhou, Arizona State University
医疗影像的一个痛点,数据少,常常需要自然图像的预训练模型做迁移学习,最广泛的预训练模型ImageNet是2D的,而医疗影像大多3D,且3D数据包含了影像的结构信息,一般而言,3D训练效果会比2D好。3D预训练模型的缺乏是本文的一个出发点。
(最近腾讯有出一个3D医疗影像的预训练模型https://github.com/Tencent/MedicalNet)
主要思想
既然缺乏3D预训练模型,那如何利用手头的数据自己生成一个预训练模型?很自然的想到用autoencoder,通过图像重建的过程让encoder, decoder 网络学习特征,之后再利用训练好的encoder, decoder 来做分割或分类任务
。这个思路早已有之,但作者创新的一点是,encoder输入的不是原图,而是引入了3类数据增强方法对影像进行变换,强迫Encoder, Decoder将变换后的影像恢复成原图,使得网络学习到数据的形状特征,纹理特征以及上下文特征。
这个思路算是很简单了。但是作者实验做得很详尽,在6个数据集上做出的效果都很突出。
我的笔记
simple idea + elaborate experiments + scientific analysis