[论文评析]C-Mixup: Improving Generalization in Regression, NeurIPS,2022

最新推荐文章于 2024-07-07 17:43:14 发布

MasterQKK 被注册

最新推荐文章于 2024-07-07 17:43:14 发布

阅读量722

点赞数

文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/QKK612501/article/details/130872696

版权

C-Mixup是一种针对回归任务的Mixup变体，通过基于标签距离的正态核计算采样概率，避免了随机插值带来的无意义样本。这种方法能有效提升模型在回归任务上的泛化性能。在C-Mixup中，样本不是随机混合，而是根据它们的标签距离以特定概率进行混合，从而优化采样策略。

摘要由CSDN通过智能技术生成

C-Mixup: Improving Generalization in Regression

前言
C-Mixup
References

前言

Mixup方法是针对分类任务的, 这篇方法相当于时提出了regression版本的Mixup, 实验证实能够大幅提升在regression task上的泛化能力.

C-Mixup

是否可以把Mixup直接用于Regression task呢?

在原始的用于classification task的Mixup 中, 每次随机选择两个sample-label进行插值, 在回归任务中可以这样做吗? 答案是不可以, 作者举了如下的例子:

在这里插入图片描述
这是一个姿势预测任务，旨在预测对象相对于其规范方向的当前方向, 可以发现: mixup的随机采样产生三种混合样本的概率相等, 然而第2,3个pairs生成的sample的label实际上是没有意义的, 只有第1个pair产生的新样本是合理的 (pair1 中两个待查核自样本的label很接近), 此外利用input feature来计算距离发现pair1 和pair3的采样概率近似相等,这也是不合理的. 我们希望: pair 1产生的样本被采样的概率远大于其余两个.