AI绘画:Stable Diffusion:初识与安装

前言

为了 ”易入门,快上手“ ,我去掉了复杂的技术原理解释,降低门槛,因为它不会影响入门使用。后期会在合适的内容中逐一讲解,利于理解。如有探索欲,建议研读论文(High-Resolution Image Synthesis with Latent Diffusion Models)。

一、Stable Diffusion 是什么?

Stable Diffusion(以下简称SD) 是一个能将文本转化为图像的潜扩散模型(Latent Diffusion Model)

二、Stable Diffusion 的基本功能

给它一些文字作为提示,它给你符合条件的图像。

Stable Diffusion 运行3要素:条件、模型、方式

三、Stable Diffusion 的优势

  • 免费

  • 生成图像质量高,需要持续深入学习,因为它的下限也很低。

  • 开源,生态丰富,有大量的插件和风格化模型,不断扩充和完善SD的创作和控制能力。

  • 自由灵活,用户可以自行训练特定主题或风格的模型,满足特定的创作需求。

  • 本地部署,消费级显卡即可迎战,数据安全。

同类AI绘画工具还有 Midjourney、Dall-E 等,它们上手更简单,用户通过简单了解后,便能做出精美画作。但它们属于闭源应用,用户只能基于厂家的设定框架使用,定制化创作能力和精细化控制能力均有所受限。

四、Stable Diffusion 能做什么?

1. 文生图(text2image)

文生图是SD最基本的能力,给它一些文字作为提示条件,它给出符合条件的图像。

文生图工作流程图

2. 图生图(image2image)

图生图是用一幅原始图作为提示条件,绘制出一幅近似它的新图像。也可以同时添加文字提示,新图像会受文字和原始图像的双重条件影响。

图生图工作流程图

3. 重绘(Inpainting)

重绘是将一幅原始图的局部或整体重新绘制出新的内容,新内容也可以通过文字作为提示条件。

以下是几种常用的应用类型:

局部修复、放大图像分辨率

画幅和细节延展

局部换装(原照片取自网络素材,如有侵权请告知。)

4. 制作视频(Make videos)

SD制作视频有两种方法:

1. 通过文字生成,deforum 就是一款非常流行的文字转视频的工具。

2. 通过视频生成,基于一个原视频,结合文字提示,生成出一个新视频。

原视频(取自网络素材,如有侵权请告知。)

生成视频

Stable Diffusion 的强大能力和生态发展,激发创作者们不断地探索应用场景和惊艳的效果。

五、Stable Diffusion 本地安装(Windows)

Stable Diffusion 原本应用在代码环境中,随着各种用户界面被开发出来,如Stable Diffusion WebUI、ComfyUI、Fooocus和StableSwarmUI等,普通用户才得以使用。

Stable Diffusion WebUI 当属目前最流行的用户界面之一,它出现最早,生态庞大,插件丰富。

如果想省心,可以使用秋葉大佬的整合包。以下内容为喜欢自己折腾的技术控朋友们准备。(需要网络畅通)

硬件要求

最低配置建议,上无封顶。

  • CPU:10代i5

  • 内存:16G DDR4内存

  • 显卡:Nvdia RTX 2060super 8G

  • 硬盘:1T以上

  • 如有预算升级配置,优先顺序:显卡(优先大显存) > 内存 > 固态硬盘

安装驱动

1. 更新显卡驱动到最新版本

2. 安装CUDA工具包

  • 查询显卡CUDA版本:打开CMD控制台,输入以下指令

    nvidia-smi
    
  • 下载版本适配的CUDA工具包

  • 安装后检查状态:打开CMD控制台,输入以下指令

    nvcc -V
    

3. 安装CUDA深度神经网络库(提速)—— cuDNN(CUDA Deep Neural Networks library)

  • 查看版本匹配要求)

  • cuDNN下载 ,将文件夹“bin、include、lib"复制到cuda v1.2.x内,通常默认路径为:C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/

安装运行依赖

1. 安装 Python 3.10.6,安装时勾选 “Add Python to PATH”。

  • 检查安装是否成功:打开CMD控制台,输入以下指令

    Python
    

2. 安装 Git(分布式版本管理软件,几乎所有关于SD的用户界面程序、插件、脚本都在这里)

  • 检查安装是否成功:启动控制台(Win+R > 输入cmd),在控制台输入指令

    git --version
    
  • 解决网络问题:如果发现网络OK,但git失败,下载 host 将内容加入到电脑中host文件末尾。

3. 安装 FFMPEG(用于录制、转换和串流式传输音视频内容。一些插件会需要。例如 Temporal Kit)

  • 步骤1:解压文件,打开到有ffmpeg.exe的路径,复制路径

  • 步骤2:右键My PC > 属性 > 高级系统设置 > 高级 > 环境变量 > 找到系统变量中的Path > 编辑 > 新建 > 粘贴路径

  • 步骤3:打开CMD控制台,输入指令以下,显示满屏字则成功。

    ffmpeg
    

4. 安装 Visual Studio

5. 选择性安装 Cmake(某些AI程序依赖是C语言写的,建议安装,避免安装依赖时报错)

本地安装 Stable Diffusion WebUI

1. 下载安装 Automatic1111的sd webui

  • 步骤1:在安装目录下启动控制台

  • 步骤2:输入以下指令

    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
    
  • 步骤3:下载基础模型,例如 v1-5-pruned-emaonly.safetensors,存储到 \models\Stable-diffusion\

  • 步骤4:用记事本打开 webui-user.bat,首行添加文字 git pull(每次运行时自动检测更新),在set PYTHON= 后面添加Python文件地址(右键点击Python.exe,复制文件地址。)

2. 版本升级与降级

某些插件因长久未更新,可能与新版sd-webui不兼容,因此需要降低sd-webui版本。

  • 更新到最新版本:用记事本打开 webui-user.bat,添加文字 git pull,保存后运行。

  • 恢复到指定版本:用记事本打开 webui-user.bat,添加文字 git reset --hard 版本ID,保存后运行。版本ID查询(AUTOMATIC1111的Releases页面)。以1.10.0-RC版本类似:

3. 汉化

  • 步骤1:安装汉化扩展,URL地址:https://github.com/VinsonLaro/stable-diffusion-webui-chinese

  • 步骤2:设置 > Ueser interface > Localization(requires Reload UI) > 选择chinese-all 或 chinese-english

除此以外还可以云部署,网上的安装教程有很多,我决定不增加篇幅了。

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好,需要的点击下方插件,即可前往免费领取!

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值