复习整理 Mask R-CNN

最新推荐文章于 2022-07-16 10:11:33 发布

MIngo的成长

最新推荐文章于 2022-07-16 10:11:33 发布

阅读量315

点赞数

分类专栏： MaskRcnn 识别手写字符深度学习文章标签： cnn 深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38732601/article/details/108320528

版权

深度学习同时被 2 个专栏收录

9 篇文章 2 订阅

订阅专栏

MaskRcnn 识别手写字符

4 篇文章 0 订阅

订阅专栏

理解Mask R-CNN

文章目录

理解Mask R-CNN
前言
一、简介

前言

为了综合复习 Mask R-CNN 写一个博客
简言之：物体检测+产生一个切割mask(识别)
和FasterR−CNN区别：能生成一个检测框

一、简介

基础点

名词解释

物体检测：Fast/Faster R−CNN
通常包含两个问题，一是判断属于某个特定类的物体是否出现在图中；二是对该物体进行定位（常用表征就是物体的边界框）可实现输入测试图片，输出检测到的物体类别和位置。

语义分割 Fully Convolutional Network (FCN)
简单而言就是给定一张图片，对图片上的每一个像素点分类

实例分割
物体检测和语义分割的综合体。相对物体检测的边界框，实例分割可精确到物体的边缘；相对语义分割，实例分割可以标注出图上同一物体的不同个体

在这里插入图片描述

简单复习

Mask R-CNN沿用了Faster R-CNN的思想，特征提取采用ResNet-FPN的架构（多尺度，详见博客），其次，Mask R-CNN将Faster R-CNN的RoI Pooling改为了RoI Align，另外多加了一个Mask预测分支。综上，Mask R-CNN一共有以下三点改进：

新加了一个mask分支；
用ResNet-FPN做backbone，有利于多尺度物体的检测和分割；
RoI Pooling -> RoI Align；
损失函数
Lcls 和 Lbox 与faster rcnn的定义没有区别。需要具体说明的是Lmask

Faster R-cnn 损失函数
在这里插入图片描述

在这里插入图片描述

可见Mask RCNN综合了很多此前优秀的研究成果，并且其在工业界中也被广泛使用，效果很好。

注：要了解Mask R-CNN，需要以下知识：（后面给出了参考文章链接，在此不再赘述。）

Faster R-CNN
（参考博客）
ResNet-FPN
（参考博客）
ResNet-FPN + Faster R-CNN
（参考博客）

在熟悉以上基础之后，我们就会发现：Mask R-CNN == ResNet-FPN + Faster R-CNN + Mask。

推荐阅读大佬文章令人拍案称奇的Mask RCNN
给了一个全面的入门讲解。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

MIngo的成长 CSDN认证博客专家 CSDN认证企业博客

码龄7年

21: 原创

19万+: 周排名

48万+: 总排名

5万+: 访问

: 等级

466: 积分

55: 粉丝

105: 获赞

14: 评论

340: 收藏

私信

关注

分类专栏

最新评论

Windows下配置Mask-RCNN环境（各种踩过的坑）
2301_77585631: 安装pytorch显示Solving environment: failed with initial frozen solve. Retrying with flexible solve. 这是怎么回事啊
CTC blank 理解
雪回: 非常感谢
CTC blank 理解
MIngo的成长: CTC 解决的是因为时序问题，输入和输出序列长度不一、无法对齐的问题，可以再看一下https://zhuanlan.zhihu.com/p/161186907 空格的话是因为标注字符中有空格，在标注的时候对空格也做标注，不是通过ctc的blank来完成的可以看一下paddleocr有关use_space_char相关的代码就能理解了
CTC blank 理解
雪回: 想请教下，识别的时候是如何区分ctc blank与空格的
python 读取图片图片预处理二值化
宇文良辰: 你好，这个文件夹需要放在什么目录下吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。