一:目标:通过少量的位置注解信息的,同时进行识别(疾病预测评分)和定位
关键词:弱监督、多实例学习
弱监督:论文中采用的训练数据中只有一少部分是标注了Bounding box的数据,而绝大多数数据仅仅只有分类而没有bbox标签。
多实例学习:文中提到,如果一张图片被标注了某种疾病的分类,那么这张图片中肯定存在至少一个patch对应于这种疾病,否则,如果一张图片被标注为健康,那么,任何一个patch都不会对应到疾病。
数据:chest x-ray image:
二、论文模型:end-to-end
网络结构
- a.将图像输入到残差网络resnet进行特征提取(残差网络去掉最后的分类层以及global pooling层)
- b.将残差网络输出的特征图resize到相同的patch大小(h' x w' 变到P x P:小的变大(双线性插值)/大的变小(maxpooling))hwc-->ppc
- c.通过全卷积网络进行分类(通过Patch Slicing之后的特征图首先送入3x3的卷基层中,得到c*个channel的