Sketch-Guided Text-to-Image Diffusion Models阅读笔记

最新推荐文章于 2024-08-16 23:18:29 发布

Liu131573

最新推荐文章于 2024-08-16 23:18:29 发布

阅读量545

点赞数

文章标签： sketch 深度学习人工智能

本文链接：https://blog.csdn.net/weixin_44901467/article/details/128222302

版权

Sketch-Guided Text-to-Image Diffusion Models阅读笔记

1. 摘要

使用了一种方法来指导text-image的生成
不需要专门训练解码器和模型

关键思想：

训练一个隐空间的指导预测器（一个小型的逐像素的多层的感知器）
作用：将噪声图像的潜在特征映射到空间图上，其中深层的特征是从DDPM的核心里提取出来的

3. 相关工作：

SDEdit:

在前向扩散过程的中途向输入的引导图像添加噪声，然后在反向过程中用引导文本去噪。这两种方法都能用图像来引导模型，而引导图像应该在RGB域，对引导图像的空间属性的保真度是有限的和随机的

Pretraining is All You Need for Image-to-Image Translation：

通过训练一个专门的、每个任务的编码器，将空间地图映射到扩散模型的潜在空间中，为各种图像翻译任务使用一个预训练的无条件扩散模型

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Liu131573

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Sketch-Guided Text-to-Image Diffusion Models阅读笔记

文章笔记ing
复制链接

扫一扫

Diffusion models多模态经典论文：详细解读Sketch-Guided Text-to-Image Diffusion Models

沉迷单车的追风少年

05-29

1547

我在博客《2023年Diffusion Models还有哪些方向值得研究(好发论文)？》当中多次提到了多模态，这也是Diffusion Models当下最火的方向之一。这篇博客和大家一起学习一下谷歌研究院出品的经典论文《Sketch-Guided Text-to-Image Diffusion Models》，借鉴背后融合多模态的手段和技巧。

ControlNet如何为扩散模型添加额外模态的引导信息？

Paper weekly

03-08

1553

©PaperWeekly 原创 ·作者 |中森单位 |IDEA研究院研究方向 |条件受控文本生成这篇文章主要讨论以下三篇论文：1. Sketch-Guided Text-to-Image Diffusion Models2. GLIGEN: Open-Set Grounded Text-to-Image Generation3. Adding Conditional Control to ...

1 条评论您还未登录，请先登录后发表或查看评论

不得不读 | 深入浅出ControlNet，一种可控生成的AIGC绘画生成算法！

idol24的博客

03-25

4816

Adding Conditional Control to Text-to-Image Diffusion Models摘要ControlNet，控制预训练大型扩散模型，以支持额外的输入条件。ControlNet以端到端方式学习特定任务的条件输入，即使训练数据集很小(< 50k)，效果也很健壮。此外，训练ControlNet的速度与微调扩散模型一样快，而且该模型可以在个人设备上训练。或者，如...

精确控制 AI 图像生成的破冰方案，ControlNet 和 T2I-Adapter

xiqiao_ce的博客

02-21

6011

ControlNet 和 T2I-Adapter 的突破性在哪里？有什么区别？其它为 T2I 扩散模型施加条件引导的相关研究ControlNet 和 T2I-Adapter 的实际应用效果如何？使用体验上，跟 SD原生支持的 img2img 有什么区别？ControlNet 在插画创作上的潜力多种条件引导的组合使用ControlNet 在3D和动画创作上的潜力哪里可以免安装且免费玩上？论文和模型这...

w1hsxn的博客

08-12

309

图像到图像翻译（Image-to-Image Translation）任务可以将一张输入图像进行指定的风格转换，也就是最终学习到一个函数能让A域图像映射到B域内，以此为基础可以解决许多实际问题，如风格迁移、属性迁移、图像超分辨率等等，在内容创作领域的应用场景十分丰富。...

Self-Supervised-Sketch-to-Image-Synthesis-PyTorch:AAAI-2021论文“Self-Supervised Sketch-to-Image Synthesis”的pytorch实现

05-30

自监督-Sketch2Image-pytorch 自监督草图到图像模型的 pytorch 实现，该论文可以在找到。0. 数据对于 CelebA 和 WikiArt 绘画图像，预处理后的 RGB 图像数据及其对应的草图图像可在此1. 说明代码结构如下： models....

react-sketch-n-sketch：直接操纵编程环境

02-06

“ Sketch-n-Sketch：SVG的输出定向编程。” 关于用户界面软件和技术的第32届ACM年度会议论文集。 2019。および，论文の论文のデモを参考に実装した，SVG画像作成するためのLive编程环境です。実装の上でを全面的...

Sketch-Export-Options：Sketch插件可帮助管理导出格式

02-06

"Sketch-Export-Options"是针对Sketch的一个插件，旨在进一步优化和管理设计稿的导出设置，提高设计师的工作效率。 Sketch的默认导出功能虽然已经相当全面，但有时并不能满足所有特定需求。Sketch-Export-Options...

react-sketch-canvas：使用SVG绘制的React组件

02-06

试试安装如果您使用npm npm i react-sketch-canvas 或与纱线yarn add react-sketch-canvas例常见用法示例import React from "react" ;import { ReactSketchCanvas } from "react-sketch-canvas" ;const style

sketch-app-icon-export：用于导出App图标的Sketch插件

02-06

"sketch-app-icon-export" 是一个专门为Sketch设计的插件，它极大地简化了设计师们创建和导出App图标的过程。这个插件的核心功能在于自动化处理App图标的不同尺寸需求。在iOS和Android平台上，为了适应不同的设备...

人工智能 | ShowMeAI资讯日报 #2022.06.06

热门推荐

ShowMeAI研究中心

06-07

1万+

ShowMeAI资讯日报 2022-06-06 期，AI领域【工具&框架】【项目&代码】【博文&分享】【数据&资源】【研究&论文】最新动态关键词：从开发到生产全链数据工程工具库、语义分割实战、Web3科学家极简入门指南…点击阅读全文...

浅析扩散模型与图像生成【应用篇】(十四)——PITI

深视

03-27

859

其思想并不复杂，就是借鉴现有视觉和NLP领域中常见的预训练方法，考虑预先在一个大规模的任务无关数据集上对扩散模型进行预训练，使其具备一个高度语义化的空间。然后，再针对特定任务对模型进行微调训练，此时微调过程只需要关注与任务相关的输入信息，而困难的图像生成工作，比如渲染一个合理布局和真实的纹理，将根据预训练时得到的知识来完成。由于扩散模型生成的结果通常分辨率较低，如64*64，因此作者也采用了一个基于扩散模型的上采样器，对生成结果进行分辨率提升。条件的引入会导致估计噪声的均值和方差发生漂移，如下。

w1hsxn的博客

07-01

136

「微调」is all you need。

SketchKnitter: 基于扩散模型的矢量化草图生成

沉迷单车的追风少年

04-26

608

SketchKnitter，这是首个用 Diffusion Models 重建矢量化草图的工作。我们证明了矢量化草图生成可以被识别为笔画变形的逆转过程，这一能力是通过扩散模型建立的。SketchKnitter 学习真实人体草图的笔画点位置和笔状态的数据分布。对于给定的随机分散笔画点，草图生成成为基于变形的去噪过程，其中生成器在每个时间步纠正笔画点的位置以收敛于可识别的草图。一项关键创新是将可识别性嵌入逆时扩散过程。据观察，反转过程中的估计噪声与草图分类精度密切相关。因此，我们使用辅助循环神经网络来量化数

Text-to-image Diffusion Model文本到图像扩散模型综述

weixin_44909476的博客

05-30

2967

Text-to-image Diffusion Model文本到图像扩散模型综述

Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models

孤独的猫

03-09

1762

联合CLIP和Diffusion的开集语义分割https://img-blog.csdnimg.cn/77b4e88f96c742109e5796053affffb1.png框架

Adding Conditional Control to Text-to-Image Diffusion Models

liguandong

03-07

3944

controlnet的核心在于给stable diffusion施加了精准控图，stable diffusion生成的图本质上是通过prompt进行引导从噪声中生成的，text是唯一的输入，controlnet输入了text之外额外的一个维度，目前论文支持canny边缘图，hough线条，hed边缘图，简笔图，pose人体姿态，分割图，深度图等。在流程上，依然是输入图片和prompt，controlnet会先从图片中提取线框图，再输入prompt和线框图即可生成新图。从技术上，controlnet对stab

2022年11月100篇 diffusion models 扩散模型汇总！

鹊踏枝-码农的专栏

12-09

2421

2022年11月100篇 diffusion models 扩散模型汇总！

Flandre Scarlet的精致蕾丝上半身造型，金发飘逸