OOD检测方法总结及两种在测试输入生成中的应用

最新推荐文章于 2023-12-24 11:24:38 发布

海苔小饼干

最新推荐文章于 2023-12-24 11:24:38 发布

阅读量1k

点赞数

分类专栏： TEST FOR AI 文章标签：机器学习人工智能深度学习软件测试测试用例

本文链接：https://blog.csdn.net/qq_40479372/article/details/129178466

版权

TEST FOR AI 专栏收录该内容

17 篇文章 3 订阅

订阅专栏

OOD检测方法：

OOD检测方法的基准提出：《A baseline for detecting misclassified and out-of-distribution examples in neural networks》

目前，OOD检测方法大致可以分为以下四类：

a. Softmax-based: 这类方法利用 pre-trained model 输出的最大 softmax 概率进行统计分析，统计发现 OOD 样本和 ID 样本 softmax 概率的分布情况，试图将二者的分布差距加大，然后选取合适的阈值来判断一个样本属于 OOD 还是 ID。这类方法简单且有效，不用修改分类模型的结构，也不需要训练一个 OOD 样本分类器。

MSP、ODIN原理：安全验证 - 知乎

b. Uncertainty: 由于模型的概率输出并不能直接表示模型的置信度(confidence)。因此这类方法让模型学习一个对输入样本的不确定性属性。面对测试数据，如果模型输入为 ID 样本，则不确定性低，相反，如果模型输入为 OOD 样本，则不确定性高。这类方法需要修改模型的网络结构来学习不确定性属性。

c. Generative Model: 这类方法主要利用 Variational Autoencoder 的 reconstruction error 或者其他度量方式来判断一个样本是否属于 ID 或 OOD 样本。主要的假设是，Autoencoder 的隐含空间(latent space) 能够学习出 ID 数据的明显特征(silent vector)，而对于 OOD 样本则不行，因此OOD样本会产生较高的 reconstruction error. 这类方法只关注 OOD 检测性能，不关注 ID 数据本来的任务。

d. Classifier: 这类方法比较直接，使用分类器对提取的特征进行分类来判断是否为OOD样本。这类方法简单直接，也取得了不错的效果，有的方法修改网络结构为一个 n+1 类分类器， n 为原本分类任务的类别数，第 n+1 类则是 OOD 类；有的方法直接取提取特征来进行分类，不需要修改网络的结构。