一文速览ICML 2023测试时自适应/在线学习相关论文

d6d88d66fa340d7e03d7fb7993d7125a.gif

现实场景中,模型不仅仅局限于单次训练,在部署之后是依然可以利用在线的数据流对模型进行一些调整,本文总结了和 Test time adaptation, online learning 场景下 ICML 2023 的相关文章。

01

/ ICML 2023 /

d1e9dbc05649d4598526542f0961a51b.png

论文标题:

Uncovering Adversarial Risks of Test-Time Adaptation

论文链接

https://arxiv.org/abs/2301.12576

这篇文章的出发点是揭示测试时适应(Test-Time Adaptation,TTA)中存在的潜在安全漏洞。TTA 是一种先进的机器学习方法,用于解决测试数据分布转移的问题。文章首先指出 TTA 的一个潜在风险,即在测试批处理中引入恶意样本可能会对最终预测模型的生成产生影响。基于这一发现,文章提出了一种名为 "Distribution Invading Attack"(DIA)的新型攻击方法,旨在通过在测试批次中引入恶意样本来干扰模型的性能。DIA 可以实现多种攻击目标,包括将关键样本的预测翻转为指定标签(有目标攻击),降低所有正常数据的性能(非选择性攻击),以及在保持正常数据准确性的同时实现第一个目标(隐蔽有目标攻击)。

文章通过在多个基准数据集上对不同的 TTA 方法进行攻击实验,展示了 DIA 的高攻击成功率。实验结果表明,在 ImageNet-C 数据集上,使用测试批次中的 5% 恶意样本进行有目标攻击可以达到超过 92% 的攻击成功率。此外,文章还对加强当前TTA方法的对策进行了探索,包括使用经过对抗训练的模型作为基础模型以抵御DIA攻击,并通过鲁棒的批归一化统计估计方法来增强 TTA 方法的鲁棒性。

不过本文提到的风险个人理解的话并不适用于所有的方法,比如 AdaNPC 这种不需要调整模型参数的方法。

02

/ ICML 2023 /

f99c601f1847fac188a7fe2f7dca5181.png

论文标题:

On Pitfalls of Test-Time Adaptation

论文链接

https://arxiv.org/abs/2306.03536

该文章的出发点是对测试时自适应(Test-Time Adaptation,TTA)方法的研究进行系统评估,并揭示现有方法中存在的一些常见问题。主要贡献是提出了一个名为 TTAB 的测试时自适应基准,包含了十种最先进的算法、多样化的分布偏移情况和两种评估协议。通过大量实验证明了先前的研究中存在的三个常见问题:1)选择适当的超参数,特别是模型选择,由于在线批处理的依赖性而变得非常困难;2)TTA 的有效性因模型的质量和特性而异;3)即使在理想的算法条件下,现有方法仍然无法解决所有常见类型的分布偏移。作者的发现强调了未来研究需要在更广泛的模型和分布偏移上进行严格评估,并重新审视 TTA 的经验成功背后的假设。

文章提到了先前研究中存在的问题,如超参数的选择困难、TTA 的有效性因模型质量和特性而异,以及现有方法无法应对所有常见类型的分布偏移。为了解决这些问题,作者提出了 TTAB 基准,用于统一评估 TTA 方法。该基准提供了一组常见数据集和多种分布偏移情况,使得可以对不同方法进行标准化评估。文章还介绍了基准的设计和设置,并说明了如何使用该基准进行评估。

具体而言,本文的核心观点在于

  1. 超参数的选择对 TTA 的有效性有很大影响,但在实践中很难进行选择,特别是在没有关于分布偏移的先验知识的情况下。常规的超参数选择方法并不一定提高测试准确性,甚至可能产生负面影响。

  2. TTA 的有效性可能在不同模型之间差异很大。模型在源域中的准确性和特性都对适应后的结果产生很大影响。此外,对于域泛化的好的数据增强方法可能对 TTA 产生负面影响。

  3. 即使在理想的算法条件下,现有方法在某些分布偏移情况下仍表现不佳。这些情况包括相关偏移(correlation shift)和标签偏移(label shift),这些偏移在 TTA 领域中很少考虑,但在领域适应和领域泛化中广泛使用。

03

/ ICML 2023 /

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值