全景分割调研(1) 问题引入与性能指标

最新推荐文章于 2024-05-25 09:30:00 发布

清欢守护者

最新推荐文章于 2024-05-25 09:30:00 发布

阅读量671

点赞数

分类专栏： CV 文章标签：全景分割 Panoptic Segmentation

本文链接：https://blog.csdn.net/irving512/article/details/118502176

版权

98 篇文章 21 订阅

订阅专栏

引入全景分割
- 下图对比了语义分割、实例分割和全景分割。
- 全景分割可以看成是语义分割和实例分割的结合：things使用实例分割，stuff使用语义分割。
- 换句话说，things区分个体，stuff不区分个体。

作者认为：
- 相比于语义分隔与实例分割，全景分割是一种更符合人类认知的感知问题。
- 相关问题研究不多，一个重要原因在于，没有合适的性能指标。
things 与 stuff
- things：countable objects，即可计数物体，如人、车等，常见算法包括目标检测、实例分割。
- stuff：amorphous regions of similar texture or material，即背景，如草地、天空、路面等，常见算法包括语义分割。
问题定义（task format）很简单：每个像素都对应一个语义标签（stuff）或实例编号（things）

定义的性能指标名为 Panoptic Quality，简称 PQ。
PQ 包含两部分内容
- segment mathing，分割匹配，换句话说，就 prediction 与 GT 进行匹配
- PQ computation given the matches，通过匹配结果计算 PQ 值
segment matching
- 当预测结果与 GT 的 IoU 大于 0.5 时，才算成功匹配
- 每个 GT segment 只能有一个匹配
- 实验证明，降低 IoU 阈值没有必要，因为很少有<0.5的匹配结果
PQ 计算
- 对每一类分别计算，然后最后求平均。这样做有利于是的类别间均衡（即不同类别的权重差不多）
- 对于所有预测和GT，有三种可能的结果
  - TP，true positive，matched pairs of segments
  - FP，false positive，unmatched predicted segments
  - FN，false negative，unmatched ground truth segments
- PQ 的公式如下
  - 下面两个公式是等价的。
  - 第二个公式有更好的可解释性（保证了PQ的Interpretability）。
  - SQ 代表分割质量，是TP中GT/Predict之间IoU之和，与所有 TP 的面积的比值，只计算 matched pairs
  - RQ 代表识别质量，定义与F1 Score相同

关注

专栏目录