引言
最近因为毕设需要用到Mask R-CNN,从网上找了很多资料学习,把觉得有帮助的一些内容收集起来,写到这篇文章中。
原理讲解
1.论文及原理
论文:http://cn.arxiv.org/pdf/1703.06870v3
参考资料:mask-rcnn解读_u010901792的专栏-CSDN博客_maskrcnn
2.代码详解
参考资料:
MASK_RCNN代码详解(1)-Basebone部分 - 知乎
MASK_RCNN代码详解(4)-Losses部分 - 知乎
MASK_RCNN代码详解(6)-ProposalLayer - 知乎
MASK_RCNN代码详解(7)-PyramidROIAlign - 知乎
MASK_RCNN代码详解(8)-DetectionTargetLayer - 知乎
环境配置
要注意的是,由于使用tensorflow-gpu版本时对cuda和cudnn的版本要求极高,一定要对应好,否则会遇到很多奇奇怪怪的问题。
训练数据集
1.如何训练自己的数据集
参考资料:MaskRCNN训练自己的数据集 小白篇 - 灰信网(软件开发博客聚合)
这篇文章描述过程非常详细,基本照着做就可以了,(目前在网上能找到的绝大部分都是基于一个DrugDataset()的代码进行改编的,需要根据自己的数据集文件将对应的文件路径进行代码修改)。
2.训练过程太慢以及数据缓存处理的技巧
参考资料:关于Mask R-CNN训练及数据读取缓慢的问题解决_Wang CVer的博客-CSDN博客_mask rcnn训练慢
这个博主根据DrugDataset()中重写的draw_mask()函数中的数据缓存导致训练过程太慢进行了修改(主要原因是draw_mask()中有一个3层for循环,导致大量cpu资源用于处理这三个for循环产生瓶颈,而gpu却很难拿到数据进行训练)。
主要分两个步骤,一是将原始数据集中的mask在训练前预处理成.npz格式(后面附的完整代码),二是在训练过程中直接读取对应的.npz文件(即已预处理好的mask),节省了cpu资源,使gpu运行效率大幅提升。
P.S. 后续遇到其他好的文章再继续更新