[2] Hybrid Task Cascade for Instance Segmentation(HTC)

只星若晨

已于 2022-04-20 21:14:47 修改

阅读量2.5k

点赞数

分类专栏： Instance Segmentation 文章标签：深度学习人工智能计算机视觉

于 2022-04-20 20:02:58 首次发布

本文链接：https://blog.csdn.net/wei2013303336/article/details/124305850

版权

Instance Segmentation 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Hybrid Task Cascade for Instance Segmentation(HTC)

0. 摘要

基于Cascade R- CNN和Mask R-CNN，有效地利用检测和分割的互补性，提出HTC：
（1）多阶段检测和分割协同学习；
（2）采用提供空间上下文信息的全卷积分枝，用于在复杂背景下分辨前景

1. 介绍

Cascade R-CNN优势：
（1）预测渐近优化
（2）自适应地处理训练分布。Cascade R-CNN与Mask R-CNN的简单结合不能在检测和分割两个任务带来均衡的性能提升。后续阶段mask的准确性依赖bbox的准确性，不同阶段的mask之间没有直接相连。
HTC在每个阶段采用多任务思路，对两个任务渐近优化。mask在不同阶段通过不同的branch直接相连，使得两种信息流可以在任务间和阶段间充分融合。
Contribution：
（1）HTC
（2）spatial contexts有利于实例分割
（3）实验

2. 相关工作

（1）Instance Segmentation
Segmentation by Detection: DeepMask,、SharpMask、InstanceFCN、MNC、FCIS、Mask R-CNN、PANet、MaskLab。
Segmentation by Segmentation：MRF/CRF based method。
（2）Multi-stage Object Detection
single-stage detector、two-stage detector、multiple stages refinement：AttractioNet、CRAFT、IoU-Net、CC- Net、Cascade R-CNN

3. Hybrid Task Cascade（HTC）

3.1 Multi-task Cascade

Cascade Mask R-CNN 在Cascade R-CNN的每个阶段添加mask prediction 和 bounding box regression。每个stage都有两个输出头： $B_t()$ 和 $M_t()$ ，把特征映射为对应的bounding box和mask。同时用于生成bound box和mask的特征向下一stage传递，防止信息丢失。
在这里插入图片描述

3.2 Interleaved execution

3.1中的bounding box和mask预测是平行的，两者的信息流之间没有任何交互，因此可以想到交替预测的方式来改进这个缺点，如下图，即 $t - 1$ 时刻的特征 $r_{t-1}$ 通过pooling产生 $t$ 时刻的特征 $X_t$ 用于bounding box预测，然后此时刻的bounding box信息向下一时刻传递，得到 $r_t$ ，用 $r_t$ 来产生 $t$ 时刻的mask，即mask的预测比bounding box预测延迟了一个stage，这样可以有效的促进bounding box对mask预测的引导作用，如下：
在这里插入图片描述

3.3 Mask Information Flow

继续添加网络层来融合当前阶段以前的所有mask信息流。
在这里插入图片描述

3.4 Hybrid Task Cascade

本文提出的HTC整体结构图。
在这里插入图片描述
（1）Mask信息传递的实现 用于在不同stage间transfer信息的卷积层设计如下：

图中 $x$ 表示RoI Pooling后的特征， $M_i$ 表示第 $i$ 个stage的mask预测头，同时 $G_t$ 表示 $1 * 1$ 卷积（图中红色框），用于将前一个stage的mask信息向后传递。

mask信息的传递过程如下：
在这里插入图片描述

思考：说的很激动、用的字母也高大尚，但是就是一个卷积层，能说会道才是王道！

（2）语义分割分支 为了更好地学习前景和背景，添加语义分割分支来支持像素级语义分割。这里其实是区别于用于提取ROI的分支而添加了另一路backbone，可以看作是两路并行的backbone。只不过一路backbone提取的特征用于RPN，另一路backbone提取的特征直接用于bounding box回归和mask预测。直观感觉S有点多余，仅提供了更多的特征。
在这里插入图片描述

（3）训练损失函数
在这里插入图片描述
公式1：总损失函数，由不同stage的bbox损失（位置回归与类别判定）与mask预测损失（二分类）按stage比重参与贡献，再加上语义分割分支的损失
公示2：不同stage的bbox损失（位置回归与类别判定损失）
公式3：不同stage的ask预测损失（二分类）
公式4：语义分割损失（交叉熵）

只星若晨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[2] Hybrid Task Cascade for Instance Segmentation(HTC)

Hybrid Task Cascade for Instance Segmentation(HTC)2.1 摘要基于Cascade R- CNN和Mask R-CNN，有效地利用检测和分割的互补性，提出HTC：（1）多阶段检测和分割协同学习；（2）采用提供空间上下文信息的全卷积分枝，用于在复杂背景下分辨前景2.2 介绍Cascade R-CNN优势：（1）预测渐近优化（2）自适应地处理训练分布。Cascade R-CNN与Mask R-CNN的简单结合不能在检测和分割两个任务带来均衡的性能提
复制链接

扫一扫