自监督动作迁移、衣服迁移-MUST-GAN论文解读

最新推荐文章于 2024-07-30 05:09:37 发布

‘Atlas’

最新推荐文章于 2024-07-30 05:09:37 发布

阅读量1.3k

点赞数

分类专栏：虚拟试衣论文详解姿态迁移文章标签：虚拟试衣姿态迁移 GAN

本文链接：https://blog.csdn.net/qq_41994006/article/details/124450209

版权

论文详解同时被 3 个专栏收录

72 篇文章

订阅专栏

虚拟试衣

6 篇文章

订阅专栏

姿态迁移

2 篇文章

订阅专栏

本文介绍了一种新颖的多层级统计量迁移模型MUST-GAN，它实现了姿态和外观特征的自监督学习，无需成对数据。MUST-GAN在人体图像生成、姿态迁移和衣服风格变换任务上达到SOTA，通过实验展示了其生成质量和消融研究。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：《MUST-GAN: Multi-level Statistics Transfer for Self-driven Person Image Generation》
github： https://github.com/TianxiangMa/MUST-GAN

创新点

姿态引导人体图像生成通常使用源图与目标图成对数据进行训练，因此数据准备成本比较大，本文提出方法从人体图像分离病转移多层次外观特征，并将它们与姿态特征进行合并进而重构源图，这种自监督方式不需要成对样本；
MUST-GAN贡献如下：
1、提出自监督图像生成方案，不需要成对数据；
2、提出多层级统计量迁移网络，解耦外表特征，用于灵活控制人体外观和姿势属性；
3、在姿态迁移和衣服风格变换任务上取得SOTA。

算法

MUST-GAN结构如图2，
在这里插入图片描述

MUST-GAN主要包括四部分：
两个分别用于人体外观和姿态的编码器、多层统计变换网络（MUST）、多层统计匹配生成网络。

Pose Encoder

编码关键点heatmap $P_a$ 以及关键点连接map $P_{a\_con}$ 到高维空间，用于引导生成网络。

Appearance Encoder

获取人体语义分割map $S_a$ ，与人体图相乘得到 $I_{a\_parts}$ ，将复杂人体分割为几部分。外观编码器为了提取不同层级的丰富鲁棒特征用于MUST模块。

Multi-level Statistics Transfer(MUST)

为了有效解耦及迁移外观属性，作者提出MUST，MUST使用外观编码器输出由浅到深4层特征，如图2b。
1、对每层特征使用channel attention（CA）获取自适应权重，通过卷积层降低channel到合适生成网络的大小（Conv）；
2、提取每层特征的统计量（均值、方差）（SE），统计量可以表征风格信息；
3、使用多个FC层（Trans）转换提取到的属性统计量，便于学习生成器中统计量的映射；
如图3，MUST可以获取并迁移更准确外观属性。
在这里插入图片描述
MUST网络可以表示为式2，

Multi-level Statistics Matching Generator

多层级统计量匹配生成器其由4个统计量匹配残差网络（SE ResBlock）构成，如图2c，过程如下：
1、从MUST获取的统计量通过AdaIN应用于生成器；
2、使用多层级残差网络作为生成器backbone，使用可学习skip connection补充残差结构；
3、双线性上采样用于逐步增加特征图分辨率；
4、最终通过1X1卷积进行重构，其结合各个channel特征。