©作者 |小欣
01 简述
实例分割(instance segmentation)是机器视觉研究中比较重要、复杂和具有挑战性的领域之一。在机器人,自动驾驶,监视等领域均有应用。
不同于语义分割(semantic segmentation),实例分割的要求更难,具体如下所示,下图(a)为语义分割,它需要预测每个像素的类别,比如分辨下图的人,羊,背景,狗;而实例分割的要求更进一步,它还需要在预测类别的基础上区分开每一个实例。
02 模型简述
在实例分割领域中,代表性的模型有Mask R-CNN等。Mask R-CNN是R-CNN系列模型的集大成者,它在Faster R-CNN的基础上进行了改进,使得它不仅能更好地解决目标检测问题,还可以用来做实例分割。
简单的来说,在理想情况下,像Mask R-CNN这种实例分割模型,它首先需要先找到一张图中哪些位置可能有物体存在,把它们从原图中找出来,称之为候选框,这里涉及到的部分是模型中的backbone, RPN (Region Proposal Network)和ROI Align层。
然后再进一步进行处理,判断找到的候选框是什么类别的,并判断候选框内中哪些像素