Stable Diffusion应用
文章平均质量分 64
探索sd的使用方式,分享相关的技巧。
wangzha_m
此行拖泥带水,此心灼若浮尘。
展开
-
Stable Diffusion 光影艺术字
使用sd制作光影文字效果原创 2024-02-29 17:40:04 · 1101 阅读 · 0 评论 -
Stable Diffusion 优质图生成技巧
在之前的博客中,为了追求功能的准确,我大都没开各种修复功能,并且都是使用很低的分辨率,这就导致以前博客中的图都不美观。今天专门分享一次如何出优质图、高清图、精致图、看上去就很美的图。原创 2024-02-22 19:26:54 · 1277 阅读 · 0 评论 -
Stable Diffusion 插件AnimateDiff
AnimateDiff可以制作动图,以插件的方式集成到sd的webUI,本文介绍了AnimateDiff的安装与使用。原创 2024-02-21 11:16:52 · 1983 阅读 · 0 评论 -
Stable Diffusion ControlNet 与艺术字(2)
如果使用的字体直线多、棱角分明,生成的图中字上的内容和提示词差距越大。比如Office带的娃娃体,可以看到字上面一点儿花的元素都没有,如下图。在笔直的字体上做了一些其他的尝试,也很难把提示内容加进去,我尝试不同的权重组合和提示词,发现最多只带有很少一部分的提示词内容。具体的配置参数写在了最后面,配置主要参考了博主。反向词:NSFW,worst quality,low quality,hand,people,提示词:Beautiful flowers in the sky,8k,realistic,原创 2024-01-10 19:25:28 · 659 阅读 · 0 评论 -
Stable Diffusion ControlNet 与艺术字
sd画的图可控性并不高,尤其是文字,比如我们想让sd生成一个带有汉字“王炸”的条幅,sd会生成条幅,但是汉字都是有形体,但是内容是不对的,如图:ControlNet为解决这一问题作出了突出贡献。sd是一种UNet,包含编码和解码的过程,文生图的过程就是字转为带有语义信息的token,并逐步附加到sd的decoder过程中。ControlNet同样也是将输入转为向量,逐步添加到生成过程。原创 2024-01-04 17:49:56 · 583 阅读 · 0 评论 -
Stable Diffusion CLIP
sd主要包含了3大块,VAE、CLIP和UNet。其中CLIP(Contrastive Language-Image Pre-training)主要是用来将提示词转为tokens,通俗的说,就是把文字转化为可以模型可以理解的信息。这些语义信息是77*768大小的向量,在UNet阶段一步一步嵌入进去,这样生成的图片就能附带提示词的内容,嵌入方式为cross attention。对输入text提取text embeddings的方式可以是其他的,目前sd主要使用OpenAI的CLIP。原创 2024-01-08 16:48:33 · 836 阅读 · 0 评论 -
Stable Diffusion UNet
UNet是sd的核心模块,值得注意的是UNet预测的是噪声,整个生成过程就是一个去噪的过程。转载 2024-01-10 14:59:14 · 90 阅读 · 0 评论 -
Stable Diffusion VAE
Stable Diffusion 中VAE的编码和解码过程的直观展示。原创 2024-01-05 18:20:10 · 1907 阅读 · 1 评论