概述
这是一篇cvpr2018的oral文章,是在无监督的情况下的情况对给定的图片和姿势生成新的图片,由于训练集的图片不是成对出现的(无监督),所以他借用了cycleGAN的思想,生成器一方面生成新的姿势图片,另一方面将其生成回原来的样子,而loss也由三部分组成,除了判别器的adversial loss外,还有姿势回归器的pose loss和特征提取器的identity loss.
方法
姿势表示方法
每个姿势由N=18个二维像素坐标组成,每个坐标对应生成一张概率密度图,该坐标对应值为1,其余部分是一个以它为峰值,方差为0.03的高斯分布,这样也就生成了N张大小为H*W的概率密度图.
生成器
生成器的结构借用了cycleGAN中的U-Net,除了encoder和decoder外,还加入了skip connection,为了防止低级别的信息损失,将第i层的所有通道都concatenate到了第n-i层.
判别器
判别器的思想主要来源于pixel2pixel中的patchGAN,对于图片中的每个patch进行判别,最终得到一个26*