论文阅读：Instance-aware Semantic Segmentation via Multi-task Network Cascades

最新推荐文章于 2020-05-19 15:22:50 发布

Ethan_Wuuu

最新推荐文章于 2020-05-19 15:22:50 发布

阅读量1.8k

点赞数 2

分类专栏：深度学习文章标签： instance 网络

本文链接：https://blog.csdn.net/Ethan_Wuuu/article/details/76842190

版权

本文提出了一种多任务网络串联方法，用于解决实例分割问题。模型包含三个子网络，分别用于区域级检测框预测、像素级掩模估计和类别级对象识别。各阶段损失函数相互依赖，实现端到端训练。技术挑战包括不同iable RoI Warping Layers和Masking layers的设计，以适应不断变化的预测框位置。

摘要由CSDN通过智能技术生成

论文框架：

作者提出一种基于多任务的网络串联方法（Multi-task Network Cascade），解决问题实例分割（Instance-aware Semantic Segmentation）。该模型分成三个子网络，differentiate instance，estimate mask，category object。分别针对三个问题，获取region-level的检测框，得到pixel-level的mask，对每个mask获得category-level的label。

流程图如下：
Multi-task Network Cascade

其中conv feature map使用VGG-16获得。
并且，该模型不同于一般的多任务网络，他的后一任务的loss依赖于前一任务的输出，所以他的三个loss都是不独立的。

I. Regressing Box-level Instance
第一个子网络获得每个目标的bounding box，和objectness score（class-agnostic，即不知道该目标属于哪一类）。
这个子网络使用Region-Proposal-Networks（RPN）的网络框架，输入是shared feature map（即特征图），连接一个3X3的卷积层用来降维，再接一个1X1的卷积层来回归box location和classifying object/non-object。
作者采用RPN的loss function ：