#今日论文推荐# 谷歌联合高校发布端到端的全景分割方法MaX-DeepLab,图像分割的伪影大幅减少且不含手动模块
图像分割技术在计算机视觉领域十分重要,通过它计算机才能将图像中的不同对象进行分割,进而理解图像内容并用于下一步的处理,这一技术被用于自动驾驶、图像识别等中。
一般来说图像分割任务是通过为属于同一类的每个像素分配标签来实现的,而其中的任务也通常涉及到对对象进行分类、检测和标记等。
图像分割大体可以分为三类:语义分割、实例分割和全景分割。“语义分割旨在为图像中的所有像素分配一个类标签;而实例分割的目的则是清楚地检测出图片中某个类的每个实例;全景分割则融合了这两种任务,是近年来新兴的分支,它主要通过预测一组不重叠的掩码及其对应的类标签来完成任务,”如下图所示。
目前的全景分割方法中的对掩码的预测这一步骤,都是通过采用多个代理子任务逐渐逼近目标来完成的。这使得之前的全景分割方法比较依赖代理子任务。
例如 Panoptic-FPN 方法的架构,就是采用了含有三个代理子任务层级的”基于框的管道”,如下图中粉红颜色的数状结构所示,全景分割掩码任务被分解为合并语义和实例分割这两个子任务,而实例分割又被进一步分解为框检测和基于框的分割,而框检测是通过锚回归和锚分类实现的。
论文题目:MaX-DeepLab: End-to-End Panoptic Segmentation with Mask Transformers
详细解读:https://www.aminer.cn/research_report/62f128e27cb68b460ffe9404https://www.aminer.cn/research_report/62f128e27cb68b460ffe9404
AMiner链接:https://www.aminer.cn/?f=cs