PointRend图像分割论文实例分割部分解读

本文解析PointRend论文,它改进了Mask R-CNN的mask预测,通过采点、点特征表示和点预测网络,提高实例分割的边界精度。PointRend在训练和推理阶段采用不同采点策略,结合细粒度和粗预测特征,生成高分辨率的实例mask。
摘要由CSDN通过智能技术生成

主要介绍实例分割,若有错误敬请指出

PointRend主要改进了Mask R-CNN 的Mask head,在Mask R-CNN的基础上,对图像中的实例边界上的点进行预测,从而生成一个更精细的mask(主要体现在边界上),能较好的提高实例分割的精度。
主要分为两部分介绍:

  1. Mask R-CNN backbone
  2. PointRend

Mask R-CNN backbone

PointRend实际上只是Mask R-CNN预测mask的一个分支,首先介绍backbone。

Mask R-CNN的backbone为ResNet50+FPN,也就是提取图像特征的网络架构,FPN为特征金字塔(top- down)和ResNet50结合(bottom- up)能输出多个尺度的feature map,这些输出的特征图按分辨率从大到小排序分别叫:P2、P3、P4、P5,在目标检测任务中可以更好地检测不同大小的实例(目标)。

若输入图像尺寸为224×224×3,通过ResNet50输出为7×7×256,输入FPN特征金字塔,输出对应P2、P3、P4、P5为56×56×256,28×28×256,14×14×256,7×7×256的feature maps。

然后将得到的这些feature maps送入RPN计算候选框(proposals),然后结合这些proposals得到proposal feature maps,最后送入ROI Align得到对齐以后固定大小的7×7×256

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值