用GAIN来补充缺失数据之论文篇（一）

最新推荐文章于 2025-04-02 19:01:05 发布

LYX0721

最新推荐文章于 2025-04-02 19:01:05 发布

阅读量4.2k

点赞数 6

分类专栏：数据挖掘文章标签：数据挖掘机器学习神经网络大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YUxuaN0721/article/details/107511260

版权

本文介绍了GAIN算法，用于补充数据缺失值。详细阐述了生成器和判别器的工作原理，包括输入、输出和损失函数。GAIN通过干扰判别器，优化损失函数，实现对缺失值的有效估计。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

用GAIN来补充缺失数据之论文篇（一）

如下图是算法的图示：在这里插入图片描述

一、定义变量

在这个算法中，我们定义如下几个变量：
通过原始数据保留未缺失的数据得到：
$\ \tilde X = \begin{cases} X_i&\text{if $M_i$ =1}\\ *&\text otherwise \end{cases}$
接下来通过训练生成器通过随机变量Z来填补：
$\\ \bar X = G(\tilde X,M,(1-M)\odot Z)$
当m=1 时，用x原始值；当m=0时，用生成器训练出的值得出最后结果。
$\ \hat X = M \odot \tilde X + (1-M) \odot \bar X$
结束定义关于数据集的变量，开始定义关于hint_matrix的变量。
首先定义一个辅助变量B。
$\ B = (B_1,...,B_d) \in {\left\{0,1\right\}}^d$

最低0.47元/天解锁文章

博客等级

码龄6年

10
原创

12
点赞

90
收藏

14
粉丝

关注

私信

热门文章

分类专栏

数据挖掘 4篇
kaggle 1篇

最新评论

怎样处理缺失数据（一）：判断缺失的模式和机制
1weN: 你好，我想问一下如果我有一个医学数据集存在原始缺失的，那我该如何进行缺失率的设置去测试不同的插补算法才是合理的呢。我目前做法是把原始缺失数据集进行成列删除得到一个一个没有缺失数据的数据集，然后在这个数据及上利用R语言的对应包和方法进行MAR和MCAR这两种缺失机制下不同缺失率的设置，然后测试不同的插补算法表现。请问这样子是合理的吗？为啥我的老师说不能这样子进行实验设置。因为我最是通过这样子的实验对比得出的最优的插补算法对原始原始缺失数据集进行插补的。
用GAIN来补充缺失数据之代码篇（一）
lala啦啦啦啦: 他这个输入数据是完整数据还是本身就是缺失值数据呀
用GAIN来补充缺失数据之论文篇（一）
LYX0721: 感谢！
用GAIN来补充缺失数据之论文篇（一）
leonardkk: 最后一行并没有错误，是对G中的参数求导，参考discriminator的更新

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。