一、数据集预处理
1.将luan16数据集标签转成voc格式。但是在后续计算loss还要看voc的标签读取和计算。
2.图片目前处理为2d的,根据annotation中的坐标,在转换为像素坐标后,根据z找到对应切片。将z-1,在,z+1的三张合成一张伪彩色。
二、模型构建
1.模型结构包括目标检测、假阳性降低(分类网络)构成。
2.目标检测包括:特征提取、检测器;特征提取用了res2,上下文增强模块(用来上采样,类似FPN的结构),空间注意力模块(用来提高定位能力)。检测器采用RPN,还需学习怎么接在上面。
3.假阳性降低使用了目标检测网络的特征图,继续通过res2模块提取特征,加入drop,加上分类器,得到概率。
4。将rpn的概率和分类器得到的概率,共同作为是不是结节的最终概率,可以考虑加权相加。
三、待做工作
1.构建train,froc。py
2.数据,标签加载方式。