题目:Deep neural networks for the detection and segmentation of the retinal fluid in OCT images.
背景介绍:这依然是一篇MICAI 2017的文章,来自于MICAI2017的workshop挑战赛,Retouch Challenge 2017.关于比赛内容以及比赛结果等信息可以点积这个链接https://retouch.grand-challenge.org/Organizers/ 。
前言:这个比赛也是MICAI2017的一个非常重要的内容,关注度非常高!主要目的是对OCT 图像进行检测与分割,主要包含了以下三个类别,intraretinal fluid (IRF), subretinal fluid (SRF), and pigment epithelial detachment (PED) 。这篇文章,给出的解决方案是2阶段的CNN,第一个网络已经完全具备了检测以及分割能力,第二个网络主要是起到一个细化,微调,提升作用!第一个网络结合了分类层,并且采用了dorpout 以及 maxout 激活函数来避免过拟合。
从画面来看源自matplot,以热度图的方式来显示的!IRF、SRF、PED这几个区域如果都让人来分辨,那么每一个volume上百张图/每个被拍摄者,那工作量是非常浩大的,而且对于标注师而言,首先是时间是个问题,其次会带入很多因疲劳而产生的错误。
图像预处理:这篇文章的预处理部分还算是比较简单的,只有reshape以及rescale,We reshape the images as size of 512×512. The image scale is 0 to 1 and the data precision is 4byte floating point。对于图像增广也是中规中矩的: flipping of the left and right, shift and resize of images。
模型结构:
从这张图中,我们可以很清晰的看到整个的网络结构,所有标记了黄色的框图内容都是需要loss的,这也是“中继监督”的训练手段!把encoder的最后一层结果直接接上一个fc层通往分类器得到检测结果!不过这里的分类并不是直接的多分类,而是利用如下table1 这样的方式做成了单分类问题!!! 这样也避免了多分类问题中的阈值设定等问题!
后面的第二阶段网络,输入是2channels的,只有原图+IRF/SRF/PED中的一个,文中第二阶段网络,对于第一阶段的分割结果三种内容是分开放在第二阶段训练的!也就是inference阶段,第二个网络可能需要运行3次!
Implementation:这篇文章是基于tensorflow用的keras写的,硬件是一个TianX 12Gb,用了Adadelta optimizer 训练了250个epoch!
实验结果: