SofGAN能产生效果很好,且能进行编辑的多视角图像。
该模型能控制pose,但其它特征编辑是通过别的论文中的方法实现的(Yujun Shen, Jinjin Gu, Xiaoou Tang, and Bolei Zhou. 2019. Interpreting the latent space
of gans for semantic face editing)
SofGAN的核心是其中的SIW-StyleGAN。SIW-StyleGAN以2D分割图和texture code作为输入,改变2D分割图和texture code就能进行多属性编辑。
这个2D分割图可以来自手动绘制,也可以由shape code自动生成。
总而言之,生成一个图片需要texture code和shape code。
shape code(z_g)决定了3D形状,用于生成3D分割图。
texture code(z_t)决定图像纹理,被用于后续的2D SIW-StyleGAN。
具体来说,z_g采样自 learned Gaussian mixture,然后输入SOF Net产生3D的分割图。SOF Net基于Occupancy Net(NeRF的前身,和NeRF类似,也是把坐标映射为特征)和hypernetwork。有了3D分割图,就可以根据ray marching找到所需角度的2D分割图。