2025年最新零基础学会Stable Diffusion!保姆级教程!

前言

最近,我惊奇地发现,还有不少粉丝朋友还没用过 AI绘画 的顶流工具——StableDiffusion,简称“SD”。

已超过20多个赞!

今天来兑现承诺,出一期零基础的AI绘画课(SD版),分为5个部分:

  • SD能有多强?

  • 电脑配置 要求

  • 软件安装

  • 基础使用流程

  • 免费在线版

1.SD能有多强?

其实,2022年8月Stable Diffusion就开源发布了,经过1年多的发展迭代,出现了非常多有趣实用的玩法。

定制二次元头像

商业模特

艺术字

还有之前很火的视频:瞬息全宇宙、央视宣传片《AI我中华》等等。

2.电脑配置要求

Stable Diffusion如此强大,而且完全本地运行,对电脑配置要求不低。

想要流畅使用SD,建议Windows 10/11系统64位,NVIDIA显卡(N卡),运行内存16GB以上,显存8GB以上。

查看方法:桌面最下方右键 -> 任务管理器 -> 性能

这电脑配置确实劝退了不少人,不满足怎么办?文末有免费在线版地址。

3.软件安装

原版的SD安装比较麻烦,python、git等等环境需要准备,不适合新手小白。

这里推荐使用赛博佛祖——秋叶大佬的一键安装包,只需要两步。

下载地址获取:后台消息回复【SD】

  1. 打开【启动器】文件夹,双击运行里面的【windowsdesktop-runtime-6.0.25-win-x64.exe】文件,安装环境

  2. 打开【秋叶整合包】文件夹,解压【sd-webui-aki-x.7z】,注意:路径中不能包含中文和空格 ,怕出错就解压到根目录吧。

进入目录,双击【A绘世启动器】

第一次启动有些慢,等待文件加载和更新。

启动器界面有很多配置,包括:模型管理、版本管理、参数设置等,感兴趣的可以多看看。

点【一键启动】,留意控制台的信息,稍等片刻,Stable Diffusion就能正常启动啦,并且浏览器自动打开一个页面,这就是SD WebUI。

如果浏览器没有自动打开,也可以手动输入网址:http://127.0.0.1:7860/?__theme=dark

4.基础使用流程

默认的安装包中没有大模型和LoRA,需要手动下载文件,并放到对应的目录下。

大模型:** _SD根目录\models\Stable-diffusion_**

LoRA:** _SD根目录\models\Lora_**

首次下载,需要刷新一下才会出现在列表里

比如,最近很火的瓷娃娃滤镜,切换图生图,设置正反提示词,上传参考图,点生成,一张美丽动人的照片就搞定啦!

5.免费在线版SD

对于大部分小白,电脑配置低是硬伤,而且大模型动辄好几G,用起来不方便。

这里推荐国内一款免费在线版的SD——哩布哩布,注册登录即可,免去复杂的配置。

可以作为小白尝鲜体验的选择,比如制作一个瓷娃娃滤镜,够用。

高级功能需要会员,比如ControlNet。

打开地址:https://www.liblib.art/,第一次使用需要扫码注册登录。

首页搜索要用到的大模型,进入详情页,点【加入模型库】,LoRA也是同样的操作。

新世界SDXL大模型:

瓷娃娃LoRA:

完成以后,点左边菜单【在线生成】进入在线版SD,或地址栏输入:https://www.liblib.art/sd

注意,在线版添加LoRA,需要下方菜单选中,设置权重,这跟本地运行的有些不同,其他的基本一致。

在AI绘画领域,如果说MJ是智能手机里的iPhone,那么SD就是安卓,用好SD,真的能解决很多问题!

这里直接将该软件分享出来给大家吧~

针对各位AIGC初学者,这里列举了一条完整的学习计划,感兴趣的可以阅读看看,希望对你的学习之路有所帮助,废话不多说,进入正题:

请添加图片描述

目标应该是这样的:

第一阶段(30天):AI-GPT从入门到深度应用

该阶段首先通过介绍AI-GPT从入门到深度应用目录结构让大家对GPT有一个简单的认识,同时知道为什么要学习GPT使用方法。然后我们会正式学习GPT深度玩法应用场景。

-----------

  • GPT的定义与概述
  • GPT与其他AI对比区别
  • GPT超强记忆力体验
  • 万能GPT如何帮你解决一切问题?
  • GPT表达方式优化
  • GPT多类复杂应用场景解读
  • 3步刨根问底获取终极方案
  • 4步提高技巧-GPT高情商沟通
  • GPT深度玩法应用场景
  • GPT高级角色扮演-教学老师
  • GPT高级角色扮演-育儿专家
  • GPT高级角色扮演-职业顾问
  • GPT高级角色扮演-专业私人健身教练
  • GPT高级角色扮演-心理健康顾问
  • GPT高级角色扮演-程序UX/UI界面开发顾问
  • GPT高级角色扮演-产品经理
  • GPT高级技巧-游戏IP角色扮演
  • GPT高级技巧-文本冒险游戏引导
  • GPT实操练习-销售行业
  • GPT实操练习-菜谱推荐
  • GPT实操练习-美容护肤
  • GPT实操练习-知识问答
  • GPT实操练习-语言学习
  • GPT实操练习-科学减脂
  • GPT实操练习-情感咨询
  • GPT实操练习-私人医生
  • GPT实操练习-语言翻译
  • GPT实操练习-作业辅导
  • GPT实操练习-聊天陪伴
  • GPT实操练习-育儿建议
  • GPT实操练习-资产配置
  • GPT实操练习-教学课程编排
  • GPT实操练习-活动策划
  • GPT实操练习-法律顾问
  • GPT实操练习-旅游指南
  • GPT实操练习-编辑剧本
  • GPT实操练习-面试招聘
  • GPT实操练习-宠物护理和训练
  • GPT实操练习-吸睛爆款标题生成
  • GPT实操练习-自媒体爆款软件拆解
  • GPT实操练习-自媒体文章创作
  • GPT实操练习-高效写作推广方案
  • GPT实操练习-星座分析
  • GPT实操练习-原创音乐创作
  • GPT实操练习-起名/解梦/写诗/写情书/写小说
  • GPT提升工作效率-Word关键字词提取
  • GPT提升工作效率-Word翻译实现
  • GPT提升工作效率-Word自动填写、排版
  • GPT提升工作效率-Word自动纠错、建议
  • GPT提升工作效率-Word批量生产优质文章
  • GPT提升工作效率-Excel自动化实现数据计算、分析
  • GPT提升工作效率-Excel快速生成、拆分及合并实战
  • GPT提升工作效率-Excel生成复杂任务实战
  • GPT提升工作效率-Excel用Chat Excel让效率起飞
  • GPT提升工作效率–PPT文档内容读取实现
  • GPT提升工作效率–PPT快速批量调整PPT文档
  • GPT提升工作效率-文件批量创建、复制、移动等高效操作
  • GPT提升工作效率-文件遍历、搜索等高效操作
  • GPT提升工作效率-邮件自动发送
  • GPT提升工作效率-邮件自动回复
  • GPT接入QQ与QQ群实战
  • GPT接入微信与微信群实战
  • GPT接入QQ与VX多用户访问实战
  • GPT接入工具与脚本部署实战
第二阶段(30天):AI-绘画进阶实战

该阶段我们正式进入AI-绘画进阶实战学习,首先通过了解AI绘画定义与概述 ,AI绘画的应用领域 ,PAI绘画与传统绘画的区别 ,AI绘画的工具分类介绍的基本概念,以及AI绘画工具Midjourney、Stable Diffusion的使用方法,还有AI绘画插件和模板的使用为我们接下来的实战设计学习做铺垫。

  • -----------
    AI绘画定义与概述
  • AI绘画的应用领域
  • AI绘画与传统绘画的区别
  • AI绘画的工具分类介绍
  • AI绘画工具-Midjourney
  • AI绘画工具-百度文心一格
  • AI绘画工具-SDWebUI
  • AI绘画工具-Vega AI
  • AI绘画工具-微信中的AI绘画小程序
  • Midjourney学习-Discord账号的注册
  • Midjourney Bot界面讲解
  • Midjourney提示词入门
  • Midjourney高级提示词
  • Midjourney版本参数学解读
  • Midjourney功能参数
  • Midjourney上采样参数
  • AI绘画组合应用1-Midjourney + GPT
  • AI绘画组合应用2-Stable Diffusion + GPT
  • AI绘画组合应用3-AI绘画+ GPT +小红书
  • AI绘画组合应用4-AI绘画+ GPT +抖音
  • AI绘画组合应用5-AI绘画+ GPT +公众号
  • AI绘画组合应用6-AI绘画+ GPT + AI视频
  • AI绘画组合应用7-AI绘画+ GPT + 小说人物/场景
  • AI绘画设计-Logo设计
  • AI绘画设计-套用万能公式
  • AI绘画设计-引用艺术风格
  • AI绘画设计-GPT加速设计方案落地
  • AI绘画设计-Vega AI渲染线稿生成设计
  • AI绘画设计-摄影
  • AI绘画设计-头像设计
  • AI绘画设计-海报设计
  • AI绘画设计-模特换装
  • AI绘画设计-家具设计
  • AI绘画设计-潘顿椅设计
  • AI绘画设计-沙发设计
  • AI绘画设计-电视柜设计
  • AI绘画设计-包装设计的提示词构思
第三阶段(30天):AI-视频高段位

恭喜你,如果学到这里,你基本可以找到一份AIGC副业相关的工作,比如电商运营、原画设计、美工、安全分析等岗位;如果新媒体运营学的好,还可以从各大自媒体平台收获平台兼职收益。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • -----------
    AI视频定义与概述
  • AI视频制作-方案与创新
  • AI视频制作-各种工具实操
  • AI视频制作-美学风格(油画/插画/日漫/水墨)
  • AI视频制作-形象设定(人物形象服装/造型/表情)
  • AI视频画面特效处理
  • AI视频画面拼接
  • AI视频画面配音
  • AI视频画面包装
  • AI视频锁定人物逐一精修
  • 多种表情动作/情节
  • 动态模型转换-视频内部元素关键帧
  • 动态模型转换-图像整体运动
  • 动态模型转换-虚拟人
  • 动态模型转换-表面特效
  • AI自媒体视频-深问GPT,获取方案
  • AI自媒体视频-风格设置(诗歌/文言文等)
  • AI自媒体视频-各行业创意视频设计思路
  • AI视频风格转换
  • AI视频字数压缩
  • AI视频同类型衍生
  • AI视频Pormpt公式
第四阶段(20天):AI-虚拟数字人课程
  • -----------
    AI数字人工具简介
  • AI工作台界面功能展示及介绍
  • AI数字人任务确定
  • AI数字人素材准备
  • AI知识、语料的投喂
  • AI模型训练
  • AI训练成果展示及改进
  • AI数字人直播系统工具使用
  • AI人物在各平台直播
  • AI数字人在OBS平台直播
第五阶段(45天以上):AIGC-多渠道变现课程

该阶段是项目演练阶段,大家通过使用之前学习过的AIGC基础知识,项目中分别应用到了新媒体、电子商务等岗位能帮助大家在主流的新媒体和电商平台引流和带货变现。

-----------

  • AI-小红书引流变现
  • AI-公众号引流变现
  • AI-知乎引流变现
  • AI-抖音引流/带货变现
  • AI-写作变现
  • AI-B站引流变现
  • AI-快手引流变现
  • AI-百家号引流变现
  • AI-制作素材模板出售变现
  • AI-周边定制变现
  • AI-手机壳图案定制变现
  • AI-周边产品定制变现
  • AI-服装图案定制变现
  • AI-个性头像定制变现
  • AI-起号与知识付费变现
  • AI-实现淘宝销售变现

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名AIGC的正确特征了。

这份完整版的AIGC资料我已经打包好,需要的点击下方二维码,即可前往免费领取!

请添加图片描述

在这里插入图片描述

<think>好的,我现在需要帮助用户了解Stable Diffusion的工作原理和操作方法,特别是他们提到的图解教程零基础入门。首先,我需要整理Stable Diffusion的三个主要组成部分:变分自编码器(VAE)、U-Net和文本编码器。用户可能对每个部分的作用不太清楚,所以我要逐一解释。 接下来,用户可能需要知道扩散过程的具体步骤,包括前向扩散和反向去噪。这里需要区分像素空间和潜在空间,解释为什么潜在空间更高效。同时,结合引用中的信息,比如潜在扩散模型(LDM)的优势是降低计算需求,这点很重要,需要强调。 然后,操作方法部分,用户可能想知道如何使用现有的工具或代码来运行Stable Diffusion。需要提到文本编码器如何处理输入提示,以及负面关键词的应用,引用中的通用负面关键词可以作为例子,但也要提醒用户可以自行添加。 关于图解教程,虽然不能直接提供图片,但可以描述结构图的大致内容,比如VAE的编码和解码过程,U-Net的残差连接结构。可能还需要解释扩散模型的插值任务,如引用2提到的,但用户的问题主要集中在原理和操作,这部分可能次要。 需要确保回答符合系统指令:使用正确的中文,数学公式用$...$,独立公式用$$...$$,并且生成相关问题。同时,引用要自然添加在段落末尾。检查是否有遗漏的部分,比如VAE如何压缩图像,U-Net如何逐步去噪,文本编码器的作用等。最后,确保生成的相关问题与用户的问题相关,比如优化方法、应用场景、安装步骤等。</think>### Stable Diffusion 工作原理详解 Stable Diffusion 是**潜在扩散模型(Latent Diffusion Model, LDM)**的典型应用,其核心流程可分为以下三个阶段: --- #### 一、核心组件与作用 1. **变分自编码器(VAE)** - 作用:将高维像素空间(如$512 \times 512$图像)压缩到低维潜在空间(如$64 \times 64$),降低计算复杂度[^3]。 - 数学表达: $$ z = \text{VAE}_\text{encoder}(x),\quad x' = \text{VAE}_\text{decoder}(z) $$ - 优势:潜在空间维度远低于像素空间,训练效率提升约**45%**。 2. **U-Net** - 结构特点:包含残差连接(ResNet)与注意力机制,逐步去除潜在空间中的噪声。 - 扩散过程:通过反向扩散从$z_T$(纯噪声)逐步生成$z_0$(清晰潜在表示)。 3. **文本编码器(CLIP)** - 将文本提示(如"星空下的城堡")转换为条件向量,通过交叉注意力机制指导图像生成。 --- #### 二、扩散过程图解(文字描述) 1. **前向扩散(加噪)** - 对潜在表示$z_0$逐步添加高斯噪声,经过$T$步后得到$z_T \sim \mathcal{N}(0, I)$。 - 每步噪声强度由调度算法(如DDPM、DDIM)控制。 2. **反向去噪(生成)** - U-Net预测当前步的噪声$\epsilon_\theta(z_t, t, \text{text})$,通过迭代更新: $$ z_{t-1} = \frac{1}{\sqrt{\alpha_t}} \left( z_t - \frac{1-\alpha_t}{\sqrt{1-\bar{\alpha}_t}} \epsilon_\theta \right) + \sigma_t \epsilon $$ - 最终将$z_0$通过VAE解码器还原为像素空间图像。 --- #### 三、操作步骤(零基础入门) 1. **输入配置** - 正向提示:描述目标内容(如"A cat wearing sunglasses, cyberpunk style") - 负面提示:排除不需要的元素(如引用[4]提供的"low quality, blurry") 2. **参数调节** - 采样步数:20-50步(步数↑→质量↑,速度↓) - 引导强度(CFG Scale):7-12(值↑→文本对齐↑,多样性↓) - 随机种子:固定种子可复现结果 3. **生成流程** ```python # 伪代码示例 prompt = "星空下的城堡,4K高清" negative_prompt = "低质量,模糊" latent = torch.randn((1,4,64,64)) # 初始化噪声 for t in timesteps: noise_pred = unet(latent, t, text_embeddings) latent = scheduler.step(noise_pred, t, latent) image = vae.decode(latent) ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值