Improving Diffusion Models for AuthenticVirtual Try-on in the Wild # 论文阅读

URL

https://arxiv.org/pdf/2403.05139
主页:https://arxiv.org/pdf/2403.05139

TL;DR

24 年 3 月韩国的一篇文章,用 reference net 做换装
在这里插入图片描述

Model & Method

ppl 如下图,和之前认知的 reference net 的区别是,本文训练的是 denoising unet 而不是 reference net。

  • 待替换的服装 + 该服装详细的 caption 作为 reference net 的输入,提取 feature 之后通过 self attn 注入 denoising net 中。
  • 参考人物图提取衣服的前背景 + 3dmm 之后,concat 到一起送入到 denoising unet 里。
  • 同时要替换的服装也会通过 ipdapter + cross attn 提取语义特征注入到 denoising unet 内。
  • 两个 unet 的 text prompt 是不同的
    在这里插入图片描述

Dataset & Results

Thought

  • 思路反过来了,不训练 reference net,训练 denoising net。这样的话可以让 reference net 发挥想要的作用吗?
  • 分治的思路值得参考:
    • id 和物体特征信息分别通过 cross attn、self-attn 方式注入。
    • 物体特征信息又细分了 semantic、fine-grained 特征,通过不同网络提取出来 concat 到一起去,然后注入 self-attn
  • 8
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值