本文发表在2018年的arXIV上,通过Attention机制,让计算机关注病理区域,在ChestX-ray14数据集上,达到了state-of-the-art的性能。
本文的想法思路来得很自然,医生在阅读胸片时通常先整体看片子中是否有问题,然后再集中精力看有病理可能的局部区域,最后在结合整张片观察,确定病理结论。本文的算法也按照这种思路,提出一种Attention-guided Convolutional Neural Network(AG-CNN)。
算法分为三部分:1、Global branch:输入整张胸片,数据经过了常用的数据增强手段处理,从中提取出可疑区域(mask)。2、Local branch:输入为步骤一输出的可疑区域,网络模型同Global branch,这一部分体现了attention机制。3、将Global branch和Local branch训练输出的特征图通过fusion branch的池化层进行连接,输出最后的结果。几个步骤中使用的CNN为ResNet-50和Dense-CNN,损失函数使用binarycross-entropy(BCE)。网络模型如下图:
算法描述如下:
完整的胸片在经历globalbranch后会计算出mask局域,标识出可能存在病理的区域,使用热力图可视化展示,这里有一个关键的阈值参数来确定mask的大小,通过实验该数值在0.7时网络效果最好。
文章对比了几种baseline算法,看出在该数据集上达到了state-of-the-art。
同时实验对比了几种不同的训练方式:先训练global 和local branch,再训练fusion以及序列化的训练global,local和fusion,最终发现序列化效果最好。