这篇论文解决了StackGan端到端的问题,stackGan是分层训练的,而本文的网络结构是一个金字塔结构的,且解决了StackGan中文字图片不匹配的问题,他使用了文字与图片匹配对,他与StackGan没有太大差距,都是为了生成清晰的图片使用了层级的结构,但是本篇论文为自己的金字塔层级结构设计了合理的生成和判别器以及对应的loss。目测与stackGan++有相似之处。
暂时不知道是几层,– scale {64,128,256}–但随着分辨率的增加,但应该会花很长时间训练。
接下来,就看看如何做的。
感觉受益了,A的代表作品是StackGan,将第一个Gan生成的图片作为stage2的辅助输入。B代表是NIPS中的Dual Discriminator Generative Adversarial Nets,使用多判别器来判别图像生成效果,C是progressive growing of GANs for improved quality。发现A与C是相似的,1和n stage 的差距。然后D,结构确实不错,从图中观察的话,是明显的。下面具体讲一下结构。
本篇论文网络结构设计灵感来源于CNN,利用之前中层的表示来辅助最终的识别分割等任务,生成器是结构类似于一个深度连接的CNN结构,中层的特征作为一个生成器的输出,然后对于这个中层输出的特征设计了与之对应的独立的判别器结构。每一个判别器学习了不同尺度上下文的判别特征。<