生成网络
网络包含两个生成网络,分别为G1,G2.
生成网络G1输入为condition image和target pos的串联,生成粗略的姿势图像,即coarse result.
生成网络G2,将condition image,与生成网络G1的输入串联,输入G2,生成一个difference map.
将G1,G2生成图像相加得到最后的生成图像,即refined result.
判别网络
判别网络用于判别输入图像是真实图像(target image)还是假的图像(生成图像).
即将target image 与condition image串联,输入判别网络,希望判别网络判别为real(预测值为1).
将refined result 与condition image串联,输入判别网络,希望判别网络判别为fake(预测值为0).