SOLOv2算法解读

‘Atlas’

已于 2022-07-24 19:51:36 修改

阅读量1.5w

点赞数 6

分类专栏：实例分割论文详解深度学习文章标签： SOLOv2 实例分割深度学习

于 2020-03-29 21:09:40 首次发布

本文链接：https://blog.csdn.net/qq_41994006/article/details/105184200

版权

论文详解同时被 3 个专栏收录

72 篇文章

订阅专栏

深度学习

45 篇文章

订阅专栏

实例分割

10 篇文章

订阅专栏

论文：SOLOv2: Dynamic, Faster and Stronger

论文链接：https://arxiv.org/abs/2003.10152

代码链接：GitHub - aim-uofa/AdelaiDet: AdelaiDet is an open source toolbox for multiple instance-level detection and recognition tasks.

SOLO算法解读链接：SOLO算法解读_‘Atlas’的博客-CSDN博客_solo

创新点

SOLOv2主要有两个创新点：

1、作者更进一步，引入动态机制，动态学习目标分割器的mask head。将mask分支解耦为kernal分支以及mask特征分支，学习卷积核权重。

2、作者提出Matrix NMS，减少前向推理时间。

效果：在单张V100显卡，coco数据集上Res-50-FPN SOLOv2，AP达到38.8%，耗时18FPS。

Dynamic Instance Segmentation

如图2所示，在SOLOv1中，mask分支如2（a）所示，由于参数量较多，而且预测结果存在冗余信息，因此进行解耦如图2（b）所示，但都是从预测结果层面出发。对此作者想到为什么不从卷积核角度出发，由此得到2（c），上面为mask kernal分支，下面为mask特征分支。

对于mask kernal分支，如图2（c）所示，输入特征F为H*W*E，学习动态卷积核G为S*S*D，比如G为1*1*E*S^2或3*3*E*S^2，即为D=E或者D=9E。输入channel为E，输出channel为S^2，S^2表示共有S^2个位置，每个位置对应一个卷积核。因此最多生成S^2个mask，此时意味着，每个位置都出现了目标。作者使用不同大小及channel卷积核，实验效果如表3所示。

对于mask特征分支，可以每层FPN都做mask预测，也可以合并为一个统一的mask，经作者实验，后者效果更佳，如图3所示。将FPN的P2到P5层依次经过3×3卷积 + group norm + ReLU + 2个双线性插值，统一到原图的1/4尺寸，再做element-wise summation，经过1 × 1 convolution + group norm + ReLU得到mask的feature map F。