论文阅读:Synthesize then Compare: Detecting Failures and Anomalies for Semantic Segmentation

本文提出一种新方法,通过合成图像并比较与输入图像的差异来检测语义分割任务中的失败和异常。使用cGAN网络进行语义到图像的转换,该框架在三个数据集上取得最佳的失败和异常检测结果。实验表明,这种方法在多个度量上优于现有技术,并揭示了深度网络的高置信度预测问题。
摘要由CSDN通过智能技术生成

Synthesize then Compare: Detecting Failures and Anomalies for Semantic Segmentation

摘要

在这里插入图片描述

失败和异常监测能力是计算机视觉任务的基本要求,常规的作法是用模型生成的分割图ground truth作比较来判断模型的好坏。

作者这里并没有使用这个方法。

作者提出问题:既然合成图像可用来测试网络框架的好坏,那么由网络得到的分割图,分割效果越好的话,是否由分割结果生成的合成图像越接近输入图像?

该想法逻辑上是行得通的。

例如:如果人被误分割为杆,则根据分割结果生成的合成图像看起来不像人,并且合成图像和输入图像之间应该出现明显差异。

同样,当测试图像中出现异常(OOD)对象时,它将被分类为分割结果中的任何可能的分布内对象,然后再根据分割结果生成的合成图像中表现为分布内对象。

因此,可以通过找出输入图像和合成图像之间的差异来判断网络框架的好坏。

所以整个过程分为了两个阶段

step1:分割结果用来重构输入图像

step2:计算合成图像和初始图像之间的差异。

在这里插入图片描述图1用来举例:(i)失败检测和(ii)异常检测

(i)上面是一个 Image-level 的IoU 分数,下面是 Pixel-level 的错误映射图。

(ii)对于异常物体(直升机),得到它的分割图

主要贡献

在这里插入图片描述

  • 第一个系统地研究用于语义分割的失败检测和异常检测
  • 提出一个统一的框架,受益于 semantic-to-image 的 cGan 网络来解决这两个任务
  • 该框架在三个数据集上获得当下最优的失败检测和异常检测结果

核心模块

在这里插入图片描述
因为需要做 semantic-to-image 的合成,所以该网络的核心模块是 cGAN。

主要流程

在这里插入图片描述

图2说明了该网络的主要流程

Methodology

在这里插入图片描述Training

Eq.1 是GAN 网络的 min-max 公式,先 max D,固定生成器G,让判别器G最大限度的区分合成图和真实图;再 min G ,固定判别器D,让生成器G尽可能的缩小合成图和真实图之间的差异。

Eq.2 是 Eq.1 的具体表达式

Testing

训练完成后,固定生成器G,图像 x 输入到模型 M 中,得到对应的分割图 y ^ = M ( x ) \hat{y}=M(x) y^=M(x),将分割图输入到生成器G中,得到对应的合成图 x ^ = G ( y ^ ) \hat{x}=G(\hat{y})

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值