图像全景语义分割是人工智能计算机视觉领域的一个重要分支,它结合了图像分类、目标检测与图像分割等技术,是针对图像数据所进行的一种像素级分类。
经过全景语义分割处理后的图像,广泛应用于自动驾驶、无人机等场景下的机器学习,是图像处理领域最常见的一种数据标注类型。
这是一张经过全景语义分割处理后的2D图像:
图1:自动驾驶图像全景语义分割
值得注意的是,图1只是经过语义分割处理后的“视觉直观图像”,并不能直接用于机器学习。在此张图像基础上导出的“JSON”格式以及“Mask”格式数据,才能被机器识别与应用。
一.JSON格式数据
JSON,英文全称为JavaScript Object Notation,是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。
JSON格式,最早在2001年由Douglas Crockford提出,目的是取代繁琐笨重的XML格式。相较于XML格式,JSON格式有两个显著的优点:书写简单,一目了然;符合JavaScript原生语法,可以由解释引擎直接处理,不用另外添加代码。