ICML 2023 | Unleashing Mask: 挖掘模型的分布外检测能力-CSDN博客

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/131407675

本文研究发现，在机器学习模型的训练过程中，存在某个中间阶段，模型的分布外检测性能优于最终阶段。通过分析，认为模型在训练后期可能记忆了非典型样本，影响了分布外样本的识别能力。为此，提出了Unleashing Mask（UM）和UMAP方法，通过参数约束和剪枝来挖掘模型的分布外检测潜力，以提高开放世界场景中模型的可靠性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

©PaperWeekly 原创 · 作者 | Jianing Zhu，Hengzhuang Li

单位 | HKBU TMLR Group

分布外检测（Out-of-Distribution detection）是在开放世界场景（Open-world senarios）下部署可靠机器学习模型的重要任务 [1]。由于现实中待推断样本并不一定来自与训练数据相同的标签分布，使得机器学习模型意识到此类分布外样本（OOD data）对于例如自动驾驶或医疗智能等安全性需求较高的领域十分重要。

给定在原有任务下训练好的模型，之前的研究工作主要探索：1）设计不同的评分函数（score functions）进行模型不确定性估计 [1,2]；2）利用辅助异常值（auxiliary outliers）对模型进行微调 [2,3]，来获取及提升模型分辨分布外样本的能力。

考虑到分布外检测与原始任务间存在一定的任务目标差异（例如，考虑基础的分布内数据（Indistribution data, ID data）分类目标与识别分布外样本的目标）[4,5]，而现有的研究设定往往将一个训练完善的模型作为分布外检测的基础，这种任务目标差异自然地引出以下启发我们工作重要的研究问题：原有任务中训练完善的模型是否拥有最优的分布外样本分辨能力？ 如果不是，那如果找到一个对分布外检测更合适的模型基础？

沿着以上的研究问题，在本工作中我们发现：