【分布外检测】《Learning Confidence for Out-of-Distribution Detection in Neural Networks》 Arxiv‘18

最新推荐文章于 2024-05-25 09:59:14 发布

chad_lee

最新推荐文章于 2024-05-25 09:59:14 发布

阅读量688

点赞数

分类专栏：论文解读分布外检测 CV 文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanguang1470/article/details/122624626

版权

本文介绍了如何在神经网络中添加一个置信度估计分支来实现分布外（OOD）检测。模型通过学习调整分类预测与真实标签之间的插值比例，以输出样本的置信度。训练时，模型会优化包含分类和置信度的综合损失函数，并通过特定策略防止模型过于保守。实验中，作者应用了一种反向FGSM的技术增强样本的置信度，但这种方法在实际应用中的有效性受到质疑。

摘要由CSDN通过智能技术生成

这篇文章有些像“learning loss”那篇一样，一股“end to end DL system solve everything”的味道。我需要一个confidence来评估一个样本是否为OOD数据，那我的神经网络模型就输出一个confidence指标来预测当前样本。

文章虽然没有发表在会议，但是被引量很高。

Motivation

作者用一个例子来引入设计模型的动机。假设学生在考试中要回答一系列问题获得分数，途中学生可以选择请求提示获得帮助，但是请求提示会受到小惩罚。那么这个时候学生应该在有信心的题目上独立回答，没信心的题目上请求帮助。

在考试结束，统计学生使用的提示数，可以估计他们对每个问题的置信度。那么将这种相同的策略应用于神经网络，也可以使其能学习置信度估计。

模型架构

在任何正常分类预测模型中加入一个“置信估计分支”，加在模型的倒数第二层之后，和“softmax分类模块”平行，两个分支都接受相同的输入。
$\Theta) \quad p_{i}, c \in[0,1], \sum_{i=1}^{M} p_{i}=1$
以上 $p$ 代表分类概率，通过一个softmax函数获得； $c$ 代表置信度分数，通过一个sigmoid函数获得。

为了在训练过程中给模型“提示”，在原始softmax预测概率和真实标签 $y$ 之间通过插值来调整最终分类预测，其中插值的程度由网络的置信度来表示：

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。