MASK-RCNN学习
Image Segmentation
- 语义分割
像素级别分割,为图像中每个像素指定类别标记 - 实例分割
语义分割的类别区分的基础上实现个体(instence)的分割, - 全景分割
没有固定形状也能分割 - mask(掩膜)
覆盖预测单个通道,表示图像中存在特定类别的区域。
常用数据集
- pascal
- coco(80类)
- BDD100K(无人驾驶)
- camvid(无人驾驶)
- cityscapes (50个城市立体视觉)
- Mapillary Vistas (世界最大最多样化街景标注)
- Apolloscape(百度无人驾驶)
mask-RCNN原理
网络架构
- 卷积主干架构
作用:用于整个图像特征提取 - 网络头(head)
-FPN特征金字塔网络