CVPR 2021 | 《Few-Shot Human Motion Transfer by Personalized Geometry and Texture Modeling》论文解读

最新推荐文章于 2022-08-22 17:09:11 发布

kxqt233

最新推荐文章于 2022-08-22 17:09:11 发布

阅读量521

点赞数 1

分类专栏：图像生成文章标签：计算机视觉图形学图像处理

本文链接：https://blog.csdn.net/kxqt233/article/details/120027008

版权

作者和机构

在这里插入图片描述

解决的问题

用少量图像输入完成动作迁移。给定目标姿势和少量人像，生成一个新的人像。

主要贡献

提出几何生成器，用于预测准确的UV map；提出纹理生成器，生成完整的texture map。两个生成器可以共同渲染出高质量人像，用于动作迁移。

方法

给定目标姿势 $P$ 和一部分人像 ${I_j\}_{j=1}^b$ ，生成新的人像 $\hat I=f(P,\{I_j\}_{j=1}^b)$ 。 $f$ 即为要学习得到的模型。生成的人像有源图像的外表，做着目标姿势。假定源图像的背景不变，生成的图像仍使用源图像的背景，可以使用DeepLab V3等图像分割模块提取前景mask。合成的前景用 $\tilde I$ 表示。

在这里插入图片描述

作者用DensePose将人体分成24个不相交的部分。每个部分有一个映射矩阵 $C\in\R^{H\times W\times2}$ 以及纹理图 $T$ ，渲染时可以使用双线性插值进行纹理渲染 $R [x, y] = T [C [x, y]]$ 。对于每个像素 $[x, y]$ ，设 $S [x, y]$ 为该像素属于当前部分的概率，则
$\tilde I=\sum_{k=1}^nS^k[x,y]R^k[x,y]$
$S$ 和UV图由几何生成器负责生成，而 $T$ 有纹理生成器来生成。

几何生成器

在这里插入图片描述

这部分包含3个Encoder和1个Decoder： $E_W$ 负责计算目标姿势 $P$ 和源图像提取出的源姿势 $\{P_1,\dots,P_b\}$ 的相似性，以此判断哪个图像应该得到更多的注意力； $E_I$ 负责提取图像的特征； $E_P$ 负责提取目标姿势的特征； $D_G$ 负责生成 $S$ 和 $C$ 。生成器的架构类似于U-Net，在每一层Encoder和Decoder之间都会进行图中的交互。具体来说，在第 $l$ -th层(Decoder是 $(L - l)$ -th层)，进行如下计算（ $\otimes$ 为矩阵乘法）。

最低0.47元/天解锁文章

kxqt233

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2021 | 《Few-Shot Human Motion Transfer by Personalized Geometry and Texture Modeling》论文解读

作者和机构解决的问题用少量图像输入完成动作迁移。给定目标姿势和少量人像，生成一个新的人像。主要贡献提出几何生成器，用于预测准确的UV map；提出纹理生成器，生成完整的texture map。两个生成器可以共同渲染出高质量人像，用于动作迁移。方法给定目标姿势PPP和一部分人像{Ij}j=1b\{I_j\}_{j=1}^b{Ij}j=1b，生成新的人像I^=f(P,{Ij}j=1b)\hat I=f(P,\{I_j\}_{j=1}^b)I^=f(P,{Ij}j=1b)。fff即为要学习得
复制链接

扫一扫