摘要
RSNA Intracranial Hemorrhage Detection,这个比赛输入目前相对其他CV赛题来讲较为少见,是一个纯分类问题。在目前的CV赛题/Paper主要攻克的方向是检测+分类。单纯的分类的问题较为少见。(当然这也只是我的一家只见),初步想到这里最开始学CV的时候的LetNet-5这个相对来讲比较简单的模型。
比赛信息
Challenge地址:https://www.kaggle.com/c/rsna-intracranial-hemorrhage-detection/overview
思路
思路一
总览
数据预处理
最先对数据的输入的部分进行预处理,以便于能更好的学习图像的特征。
- 对图像进行融合也是目前相对比较常见的3-slices
- 对每个slices的进行窗口的选择
- 空间相邻的使用同一个窗口
方法
这里的采用了两个seq model融合进行的,结合两个模型的输出的Feature Map进行结合的到。感觉这里有点类似UNet里的skip-connection,不过在UNet中是在concat的argument是3,这里的是2。这里还是蛮像的。
Seq1
使用MLP+LSTM,输入为3slices
Seq2
使用1d CNN + LSTM
输入为:
- 来自多个2D CNN模型Logit(num_models * 6类输出)
- 来自序列模型1的Logit(6类输出)
- 元信息(位置)
总结
- 在多分类/多类识别的任务中可以结合不同的信息进行融合,例如feature集中在骨、脑
- Seq model在这里的的使用
思路二
这里采用的数据预处理在之前天池的前几名也有采用过同样的方法,就是使用剪裁去黑边(无用信息),来帮助model学习到更好的feature。其余的部分倒是与思路一有几分想像,不过是第一部分用的是两个seq model。