论文: InfoGAN: Interpretable Representation Learning byInformation Maximizing Generative Adversarial Nets
Abstract
作者提出了InfoGAN,InfoGAN作为GAN,也是最大化隐变量和观测之间的一个小的子集的互信息。但是作者将互信息的下界作为优化目标,这样可以实现高效的优化。 具体来说:InfoGAN可以学习到可解释的特征,比如情感等。
Introduction
无监督学习的目的在于从数据中学习特征,一个常见的无监督学习框架就是表示学习。表示学习对于一些下游任务比如:分类,回归,策略学习都是非常有用的。
然而,无监督学习是一个病态问题,因为相关的下游任务通常是未知的。数据的解耦表示(disentangled representation)对于相关的,但是未知的下游任务有比较好的效果。所谓的解耦表示:就是显式的表示数据的显著特征,比如对于人脸,一个有用的解耦表示就是,将人脸表情,眼睛颜色,是否带眼镜等一个个特征分别表示一个特征维度,每个维度的不同取值表示各个特征的取值。个人觉得,这个有点像数据挖掘里面做特征工程的感觉,把特征一个个分开,每个特征表示不同的含义,这样可以有效地分析什么特征对于分类问题适合,什么特征适合分割。一个无监督学习算法如果能够大概猜到下游的任务是什么,这一点是非常关键的。
无监督学习研究的一个重点就