Improving Diffusion Models for AuthenticVirtual Try-on in the Wild # 论文阅读

最新推荐文章于 2024-07-08 18:48:12 发布

奔跑的汉堡包

最新推荐文章于 2024-07-08 18:48:12 发布

阅读量281

点赞数 8

文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29679623/article/details/139041782

版权

URL

https://arxiv.org/pdf/2403.05139
主页：https://arxiv.org/pdf/2403.05139

TL;DR

24 年 3 月韩国的一篇文章，用 reference net 做换装
在这里插入图片描述

Model & Method

ppl 如下图，和之前认知的 reference net 的区别是，本文训练的是 denoising unet 而不是 reference net。

待替换的服装 + 该服装详细的 caption 作为 reference net 的输入，提取 feature 之后通过 self attn 注入 denoising net 中。
参考人物图提取衣服的前背景 + 3dmm 之后，concat 到一起送入到 denoising unet 里。
同时要替换的服装也会通过 ipdapter + cross attn 提取语义特征注入到 denoising unet 内。
两个 unet 的 text prompt 是不同的

Dataset & Results

Thought

思路反过来了，不训练 reference net，训练 denoising net。这样的话可以让 reference net 发挥想要的作用吗？
分治的思路值得参考：
- id 和物体特征信息分别通过 cross attn、self-attn 方式注入。
- 物体特征信息又细分了 semantic、fine-grained 特征，通过不同网络提取出来 concat 到一起去，然后注入 self-attn

奔跑的汉堡包

关注

8
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Improving Diffusion Models for AuthenticVirtual Try-on in the Wild # 论文阅读

主页：https://arxiv.org/pdf/2403.05139。
复制链接

扫一扫

奔跑的汉堡包

博客等级

码龄9年

37
原创

297
点赞

446
收藏

202
粉丝

关注

私信

热门文章

分类专栏

读书笔记 2篇

最新评论

Training-Free Consistent Text-to-Image Generation # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
DiT：Scalable Diffusion Models with Transformers # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Mix-of-Show: Decentralized Low-Rank Adaptation forMulti-Concept Customization # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
FastComposer: Tuning-Free Multi-Subject ImageGeneration with Localized Attention # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
SWAPANYTHING: Enabling Arbitrary ObjectSwapping in Personalized Visual Editing # 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。