[论文评析]Continuous weight balancing， ICLR,2021

MasterQKK 被注册

已于 2022-09-17 17:37:59 修改

阅读量258

点赞数

分类专栏：前沿介绍文章标签：机器学习深度学习人工智能

于 2022-09-17 17:36:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qkk612501/article/details/126907467

版权

前沿介绍专栏收录该内容

26 篇文章 5 订阅

订阅专栏

Continuous weight balancing

文章信息
动机
方法
思考
References

文章信息

题目：Continuous weight balancing
发表：ICLR, 2021
作者：Daniel J. Wu, Avoy Datta

动机

当前的不平衡回归研究实际上都是在如下场景下进行：训练集中的样本的目标y的分布是不平衡的，而目标域/测试集中的数据分布是平衡的，所以研究的目的是：从不平衡的数据集中训练出一个unbiased model。
这篇文章实际上考虑了一种更加General的场景：即目标域的分布也是不平衡的，并且不平衡的含义更加广泛，可以是目标值也可以是数据集中的特征。

方法

方法非常的简单，大致分为4步，如下图所示：
在这里插入图片描述

Step 1: 选择合适合适weight traint,

如何理解Weight trait, 它实际上是一个加权所要依据的一个连续变量，该变量可以是目标变量，也可以是特征变量。总之，特刻画了数据集中的一个特征，后续加权会基于该特性进行。

Step 2: 估计源域的分布

估计方法采用的和密度估计Kernel Density estimation (KDE)，这是一种非参数密度估计方法，其定义如下：
在这里插入图片描述

Step 3: 估计目标域的分布

估计方法与上一步类似，

Step 4: 估计权重

就是Step 3 和Step 2估计的密度的比值
在这里插入图片描述
通过上述样本权重确定方法，可以把任意不平衡的数据集转换到与任意指定目标域数据集相匹配。

下图展示了两个采用上述办法把源域转换到目标域的Demo,
在这里插入图片描述

思考

1.太简单了，没有深度，论文中实验部分很少；
2.关开头于不平衡的分析那块感觉挺有意思，不平衡可以是目标，也可以是数据集中的某个特征，而当前的不平衡研究主要都是针对目标的不平衡。但是这篇文章并没有带来新的东西，期待后续能有更加深入，迎合的研究工作。

References

1.Wu D J, Datta A. Continuous weight balancing[J]. arXiv preprint arXiv:2103.16591, 2021.

MasterQKK 被注册

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
[论文评析]Continuous weight balancing， ICLR,2021

Continuous weight balancing， ICLR, 2021,和密度估计，KDE， Kernel Density Estimation
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MasterQKK 被注册 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。