ClusterGAN知识小结
简介
ClusterGAN 是第一个解决GAN在潜在空间聚类问题的工作,通过从一个one-hot编码变量和连续潜在变量的混合中对潜在变量进行采样,结合反向网络(将数据投射到潜在空间)与聚类特定损失共同训练,能够实现在潜在空间的聚类。
主要贡献
在一般的GAN中,即使潜在变量保留了关于观测数据的信息,潜在点也会基于潜在分布而平滑地分散,导致没有可观察到的聚类。
为了解决上述问题,提出了三种主要的算法思想:
- 利用离散和连续潜在变量的混合,以在潜在空间中创建非光滑几何
- 提出了一种适应离散连续混合的新型反向传播算法,以及一个显式反向映射网络,以获得给定数据点的潜变量,因为该问题是非凸的。
- 建议联合训练GAN以及具有聚类特定损失的反向映射网络,以便投影空间中的距离几何反映变量的距离几何。
如下图所示为使用离散连续采样进行训练的结果。
结构
如下图所示为 ClusterGAN 的网络结构图,由 Generator,Discriminator,Encoder 组成,以下简称为 G,D,E,引入 E 的原因在于需要强制执行潜在向量的精确恢复:
训练流程为:从离散连续分布中采样,经过反向解码得出潜在变量,经由G