用GAIN来补充缺失数据之论文篇(一)
如下图是算法的图示:
一、定义变量
在这个算法中,我们定义如下几个变量:
通过原始数据保留未缺失的数据得到:
X ~ = { X i if M i =1 ∗ o t h e r w i s e \ \tilde X = \begin{cases} X_i&\text{if $M_i$ =1}\\ *&\text otherwise \end{cases} X~={
Xi∗if Mi =1otherwise
接下来通过训练生成器通过随机变量Z来填补:
X ˉ = G ( X ~ , M , ( 1 − M ) ⊙ Z ) \\ \bar X = G(\tilde X,M,(1-M)\odot Z) Xˉ=G(X~,M,(1−M)⊙Z)
当m=1 时,用x原始值;当m=0时,用生成器训练出的值得出最后结果。
X ^ = M ⊙ X ~ + ( 1 − M ) ⊙ X ˉ \ \hat X = M \odot \tilde X + (1-M) \odot \bar X X^=M⊙X~+(1−M)⊙Xˉ
结束定义关于数据集的变量,开始定义关于hint_matrix的变量。
首先定义一个辅助变量B。
B = ( B 1 , . . . , B d ) ∈ { 0 , 1 } d \ B = (B_1,...,B_d) \in {\left\{0,1\right\}}^d B=(B1,...,Bd