[SGDiff] A Style Guided Diffusion model for fashion synthesis

52Tiramisu

已于 2023-12-25 10:14:03 修改

阅读量461

点赞数 9

分类专栏：科研文章标签：人工智能

于 2023-12-20 10:00:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gsj9086/article/details/135096088

版权

科研专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Abstract

①提出一个风格引导的扩散模型（SGDiff），把图像模态与预训练的t2i模型组合起来。

②提出一个数据集 SG-Fashion。

Method

SGDiff Overview

公式含义：在给定时间点 t 上的输入 $x_t$ ，目标文本的语义表示 $f_T$ ，风格表示 $f_S$ 。通过扩散网络 $\epsilon_{\theta}$ 估计该时刻的噪声 $\hat{\epsilon}_t$ 。

输入：①文本text；②风格图像。

文本条件 $c_T$ 通过扩散模型的 $E_T^{diff}$ 生成 $f_T$

风格条件 $c_S$ 通过CLIP模型的 $E_S^{clip}$ 生成 $f_S$

这两个特征在 SCA 模块中进行特征融合（融合细节如下图：）

$f_T$ ： $Q,K_T,V_T=L_T(f_T)$

$f_S$ ： $K_S,V_S=L_S(f_S)$

再特征拼接：

输出 $f_m$ ：

最后再来一个 skip-connection：

Training Objective

从每一时间步骤t，获得重建图像 $\hat{x}_0$

Perceptual Loss：

Perceptual Losses for Real-Time Style Transfer and Super-Resolution. 2016

$\psi_m(\hat{x}_0)$ ， $\psi_m({x}_0)$ 分别表示生成图像 $\hat{x}_0$ 和真实图像 $x_0$ 在VGG网络的第 m 层的特征表示。

VGG网络，包含多个卷积层和池化层，用于提取图像特征。

最后基于 Improved DDPM，提出最终目标Loss：

$L^{simple}_t$

$L^{vlb}_t$

Multi-Modal Conditions

Experiment

数据集：SG-Fashion，包含17,000 张从优衣库等网站上下载的各类图片。

模型架构：GLIDE+CLIP(ViT/32)

显卡：a single RTX3090

定性比较

定量比较

收获

了解到【模态融合】相关知识；

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
[SGDiff] A Style Guided Diffusion model for fashion synthesis

①提出一个风格引导的扩散模型（SGDiff），把图像模态与预训练的t2i模型组合起来。②提出一个数据集 SG-Fashion。
复制链接

扫一扫

专栏目录

52Tiramisu CSDN认证博客专家 CSDN认证企业博客

码龄7年

310: 原创

5万+: 周排名

5万+: 总排名

14万+: 访问

: 等级

4057: 积分

174: 粉丝

248: 获赞

66: 评论

377: 收藏

私信

关注

热门文章

分类专栏

PAT 80篇
科研 8篇
CSAPP 2篇
学习方法 1篇
Python 11篇
汇编语言 2篇
Docker 4篇
Spring 7篇
MyBatis 9篇
Vue 1篇
数据库 2篇
杭电面试 3篇
软件工程
Java面试 2篇
杭电笔试 9篇
hdoj 25篇
LeetCode 42篇
数据结构 10篇
王道 3篇
Java 10篇
设计模式 1篇
环境配置 13篇
others 7篇
C/C++基础 17篇
javaee 8篇
html 3篇
JavaScript 4篇
Android 11篇

最新评论

【二叉树】专题
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
leetcode88. 合并两个有序数组
52Tiramisu: 过了4个月，思路全部忘了，这是咋回事= =
【链表】专辑
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
【链表】专辑
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
AndroidStudio Connection Reset 问题
Gyatchi: 先生快两年了㖞，就算解决都不记得啦

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。