《Mask R-CNN》-2017

《Mask R-CNN》是2017年的研究,解决了在像素级别进行对象分割的问题,提高了对象检测和特征点定位的准确性。通过在Faster R-CNN基础上增加mask分支,实现了并行的实例分割。关键创新包括RoIAlign操作,消除RoIPool的量化误差,保持像素级对应。论文中展示了Mask R-CNN在实例分割、行人姿势预测等任务上的优秀性能。
摘要由CSDN通过智能技术生成

《Mask R-CNN》 进行实例分割,就是要在每一个像素上都表示出来目标所属的具体类别。 完成类别检测,图像分割和特征点定位。
1、解决的问题:在时间上对faster rcnn进行了优化,并且提高准确度,最关键的是在像素级别进行特征点定位达到了将各个对象的边缘确定的效果。
这里写图片描述
上图是,faster rcnn的分割检测效果。下图是,mask rcnn的分割检测效果,可以明显看到,改进的地方是各个对象的边缘被勾勒了出来,这个技术是论文中提到的像素级别的特征点识别。
这里写图片描述
2、解决方法:
Mask RCNN在faster rcnn的结构上做出了改善。
大概了解了faster rcnn的网络结构,本论文也作出了简单介绍。Faster rcnn主要分为两个步骤,一是RPN,二是Fast RCNN。第一步骤主要是为了检测边缘,第二步骤是为了提取特征进行分类。faster rcnn使用NN来做区域类别的预测,在Fast-rcnn的基础上使用共享卷积层的方式。卷积后的特征图同样也是可以用来生成区域类别的预测(region proposal)。通过增加两个卷积层来实现Region Proposal Networks (RPNs) , 一个用来将每个特征图 的位置编码成一个向量,另一个则是对每一个位置输出一个 objectness score 和 regressed bounds for k region proposals.
这里写图片描述
Faster R-CNN 对每个候选对象有两个输出,即一个类标签和一个边界框偏移值。我们在 Faster R-CN

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值