虚拟试衣-DiOr论文解读

最新推荐文章于 2024-06-03 10:01:51 发布

‘Atlas’

最新推荐文章于 2024-06-03 10:01:51 发布

阅读量1.2k

点赞数

分类专栏：虚拟试衣数据生成论文详解文章标签：计算机视觉 GAN 虚拟试衣

本文链接：https://blog.csdn.net/qq_41994006/article/details/124570162

版权

论文详解同时被 3 个专栏收录

72 篇文章 15 订阅

订阅专栏

数据生成

23 篇文章 1 订阅

订阅专栏

虚拟试衣

6 篇文章 0 订阅

订阅专栏

文章目录

创新点
算法
实验
结论

论文:[《Dressing in order: Recurrent person image generation for pose transfer, virtual try-on and outfit editing》](Dressing in order: Recurrent person image generation for pose transfer, virtual try-on and outfit editing》)
github: https://github.com/cuiaiyu/dressing-in-order

创新点

DiOr支持2D姿态迁移、虚拟试衣、服装编辑任务；
DiOr重点是使用新颖的循环生成网路，将衣服按顺序穿到一个人身上，顺序不同，结果不同；

算法

DiOr整体流程如图2，
在这里插入图片描述
流程如下：
1、目标域姿态P经过Epose得到Zpose；
2、Zpose与T’body通过G循环生成状态Zk；
3、Zk经过Gdec生成图片Igen；

全局流场估计

对于源域穿着衣物 $g_k$ 的人体 $I_{gk}$ ，使用Self Correction for Human Parsing提取衣物分割 $s_{gk}$ ，使用openpose获取人体关键点估计 $P_{gk}$ ，源域姿态Pgk与目标姿态 $P$ 存在差异，使用流场 $f_{gk}$ 将 $s_{gk}$ 与目标姿态 $P$ 对齐，如图3a；
在这里插入图片描述

分割编码

对衣服分割 $s_{gk}$ 通过编码器 $E_{seg}$ 进行编码，生成空间对齐的纹理特征T及粗略的mask M；
$E_{seg}$ 模块如图3b，输入首先经过 $E_{tex}$ 对输入提取纹理信息，使用双线性插值将 $E_{tex}$ 的输出通过流场 $f_{gk}$ 进行扭曲得到纹理特征 $T_{gk}$ ， $T_{gk}$ 经过风格器S得到形状mask $M_{gk}$ ；使用 $E_{map}$ 映射 $T_{gk}$ 到合适维度，引入 $T_{gk}$ 的均值向量（ $\overline T_{gk}$ ）有助于对衣物缺失区域进行补全；如下式，
在这里插入图片描述

身体表征

如图3c，对于源域人体的身体编码过程；
对于源域人体Is经过风格得到背景mask $s_{bg}$ 及皮肤mask $s_{skin}$ ，分别经过分割编码器器 $E_{seg}$ 编码得到 $T_{bg},M_{bg})$ 和 $T_{skin},M_{skin})$ ；
为确保身体特征图贯穿整个身体区域，计算 $T_{skin}$ 均值向量b，将b broadcast到前景区域 $M_{fg}$ ，得到特征图经过 $E_{map}$ 映射到合适区域；背景 $T_{bg}$ 、 $M_{bg}$ 经过映射为 $T'_{bg}$ ，流程如式1；
在这里插入图片描述

姿态编码

姿态编码器 $E_{pose}$ ：由3个卷积层构成，每个卷积层跟随IN及leaky ReLU层；

损失函数

损失函数如式3，
在这里插入图片描述
$L_{content}$ 表示生成图像与真值之间一致性，包括L1 Loss、感知损失、风格损失；
$L_{geo}$ 表示预测流场的正确性和正则性损失；
$L_{GAN}$ 使用两个判别器：一个基于pose、另一个基于分割；
$L_{seg}$ 表示Mg与真值mask之间差异；