论文:Mask R-CNN

本文深入解析Mask R-CNN论文,它在Faster R-CNN基础上增加了一个预测二进制Mask的分支,用于实例分割。介绍了损失函数、Mask表示、RoIAlign操作,以及网络架构和实现细节。
摘要由CSDN通过智能技术生成

论文:https://arxiv.org/abs/1703.06870
代码:原配pytorch 1pytorch 2

更多 目标检测
更多 图像分割


回顾 Faster R-CNN

Faster R-CNN 包括两个阶段:

  1. 第一阶段:称为区域提议网络(RPN),提出候选目标边界框。
  2. 第二阶段:本质上是Fast R-CNN,使用 RoIPool 从每个候选框中提取特征,并进行分类和边界框回归。

这两个阶段使用的特征可以共享,以更快地进行推断。


Mask R-CNN

Faster R-CNN对每个候选目标有两个输出,一个类标签和一个边界框偏移量;为此,我们添加了第三个分支输出目标 Mask MaskMask R-CNN 包括两个阶段:

  1. 第一阶段:RPN
  2. 第二阶段:预测类、边框偏移和二进制 Mask

在这里插入图片描述


损失函数

在训练过程中,将每个采样 RoI 上的多任务损失定义为 L = L c l s + L b o x + L m a s k L = L_{cls}+ L_{box}+ L_{mask} L=Lcls

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值