1.InfoGAN
1.regular GAN
- modifying a specific dimension,no clear meaning
就是不明白改变什么维度,会对特征有什么影响
2.What is InfoGAN
- discriminator是用来判断到底是不是真实的图片
- 而classifier是用来预测此时的种类
如何解决上述的问题呢 - c must have clear influence on x
generator必须知道,c会对x有什么样子的影响 - The classifier can recover c from x
3.结果
- 改第一维可以发现数字由1变成9
- 改第二维可以发现角度发生变化
- 改第三维可以发现宽度变宽
2.VAE-GAN
1.VAE-GAN模型架构
- encoder 和 generator是 autocoder,加上encoder使generator有目标的学,更加稳
- generator 和 discriminator 是GAN,加上discriminator可以使output更加真实
- encoder:minimize reconstruction error,z close to normal
- generator:minimize reconstruction error,and cheat discriminator
- discriminator:discriminate real,generated and reconstructed images
2.Algorithm
BiGAN (两个GAN
1.结构
encoder 跟 decoder不是接在一起
虽然 encoder 和 decoder 没有连在一起,但是
2.Algorithm
技术 Domain-adversarial training
1.问题:如测试集和训练集不同
training and testing data are in different domains
2.Domain-adversarial training
- label predictor:用于识别是什么种类的
- Damain classifier:用于识别是来自哪一个领域
Not only cheat the domain classifier , but satisfying label classifier at the same time
3.Feature Disentangle
要把speaker这个因素剥除掉,所以如果判断是同一个讲话者就给high score,否则反之
Photo editing
1.结构
2.Attribute representation
找到zlong来衡量差距