小白怎么学习Stable Diffusion?看这篇就够了

本文介绍了StableDiffusion图像生成模型,包括其工作原理、应用场景、安装步骤以及学习关键——描述词的使用。同时解答了新手常见问题,提供了一份完整的StableDiffusion入门学习资源包链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

由于我之前写了不少AI绘画技术相关的故事文章,不少读者朋友知道我是AI绘画深度沉迷者,于是经常有人在微信里问我:

我刚入门AI绘画,该怎么学?要学哪些东西?有哪些方向?怎么选?

1.Stable Diffusion简介

Stable Diffusion 是一种图像生成模型,它通过逐步去除噪点来生成图像。Stable Diffusion 模型由一个编码器和一个解码器组成。编码器将图像转换为潜在表示,解码器将潜在表示转换回图像。

Stable Diffusion 模型的生成过程如下:

  1. 生成一个随机噪点。

  2. 将噪点输入编码器,得到潜在表示。

  3. 使用潜在表示生成图像。

  4. 逐渐去除图像中的噪点。

  5. 生成高质量的图像。

table Diffusion的一些主要应用场景包括:

在这里插入图片描述
1、数字艺术创作:艺术家可以通过文字描述去生成图像,辅助和激发创作灵感。

2、广告设计:可以快速地产出多种风格的图像,为广告设计提供创意。

3、游戏素材生成:用于自动生成游戏内的角色、场景、物品等图形资源。

4、社交媒体:用户可以基于语音提示生成个性化的头像和图片。

5、图书插图:插画师可以基于章节内容生成匹配的插图。

6、图像编辑:通过编辑提示文字重新生成和改变部分图像内容。

7、3D建模:辅助快速生成3D模型的蓝图和草图。

8、图像修复:可以基于非损坏区域推断出修复图片的内容。

2.Stable Diffusion安装

学习SD的第一步,就是要安装好这个软件。安装分为手动部署和自动整合包,这里推荐用自动整合包,省时省力。

我们可以先安装启动器的运行依赖,并解压秋叶包本体(安装包我放在了文末)。

第一步:打开“启动器运行依赖-dotnet-6.0.11.exe”来安装。

在这里插入图片描述

第二步:解压“sd-webui-aki-v4.zip”。

注意:

当我们解压好启动器本体的时候,暂时还不要启动,先一起把模型安装了。

在这里插入图片描述

第三步:导入核心数据。

1、下载“推荐大模型”文件夹中的模型。

在这里插入图片描述

2、并把文件夹里的所有模型放在这个目录下:

\sd-webui-aki-v4\models\Stable-diffusion

3、同时,还要下载ControlNet模型

在这里插入图片描述

4、ControlNet模型文件夹里的所有内容,放在这个目录下:

\sd-webui-aki-v4\models\ControlNet

5、最后,需要单独下载推荐LoRA

在这里插入图片描述

6、这些LoRA是笔者为了方便小伙伴们取用改了名的,需要全部放在这个目录下:

sd-webui-aki-v4\extensions\sd-webui-additional-networks\models\lora

7、当大家上手之后就可以参考末尾处这一篇文章,并在【大量模型·LoRA】文件夹中寻找自己想要的LoRA了。

在这里插入图片描述

3.学习描述词

描述词,也叫关键词,是学习 AI 绘画中关键的一环,简单来说,就是学会与 AI 沟通的语言,让它听懂你的需求,描绘出你想要的画面。即会说话,就会画画;会改数字,就会改图。

想要学好 AI 绘画,学习描述词就是必经之路,对于新手伙伴,通过复制粘贴的方式进行熟悉,是最方便快捷的方式

在这里插入图片描述

4.新手常见问题解答

Q:为什么生成的人脸不清晰,很怪异?
A:可以尝试加大出图尺寸,开启高清修复,或者使用人脸修复插件ADetailer

Q:Vae 模型是否必须要有?
A:不需要,现在的大模型很多已经自带了 vae 模型

Q:大模型和 lora 是否必须对应?
A:这个是不需要的,并且甚至我们可以对 lora 模型混搭使用

Q:为什么加了lora没效果,怎么办?
A:很多lora需要加触发词的,在关键词后面加上就好了。如果不知道触发词是什么,可以去下载lora的网站去查看

Q:无法生成全身照,尽管我添加了“full body”这种词。
A:使用 512*768 这样的纵向比例的图。或者在提升词中加入诸如“牛仔裤”此类的对下半身的描述词

Q:为什么经常出现一些多手多脚的人物?
A:可以在负面提示词里面加一些badhand、badleg之类的,或者直接用Embedding

Q:为什么我跑图跑到最后了突然显示空白,没有结果?
A:大概率是显卡崩了,将出图尺寸降低一些再跑跑看。尤其是高清修复,很容易崩。

stable diffusion全套整合包

Stable Diffusion最新软件/教程/插件/提示词/模型动作整合包!软件支持WIN10系统及以上,支持N卡、A卡、CPU出图(cpu出图慢),N卡最好在10系列及以上,A卡要求4G显以上。…

需要的点击下方链接,直接获取:

CSDN大礼包:《Stable Diffusion入门基础学习资源包》免费分享

1.stable diffusion安装包

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好,需要的点击下方链接,即可前往免费领取!

CSDN大礼包:《Stable Diffusion入门基础学习资源包》免费分享

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值