[Stable Diffusion] 三句话，让Ai帮你画18万张图（附安装包）

程序员小八

于 2024-05-11 10:32:44 发布

阅读量634

点赞数 14

文章标签： stable diffusion 人工智能网络 tcp/ip 服务器 AI绘画

本文链接：https://blog.csdn.net/z099164/article/details/138704934

版权

本文介绍Stable Diffusion的快速上手，本地部署，以及更多有趣的玩法展示。(文末领取一键安装包）

在 DALL-E 2 和 Imagen 之后，AI绘图领域又一个热乎的深度学习模型出炉——Stable Diffusion 。8月份发布的 Stable Diffusion 更加高效且轻量，可以在消费级 GPU 上运行。StableAI公司表示：“它在速度和质量上的突破意味着它可以在消费者级的 GPU 上运行。这将允许研究人员和公众在一系列条件下运行它，并使图像生成普及化。”

这意味着现在你只需一句话和几十秒的时间，就可以让你脑海中天马行空的画面出现在你眼前：

或者随手画一笔，让ai帮你加“亿点点“细节：

怎么上手玩起来

前两种方式都比较简单，Colab看起来复杂，实际上一步一步按照提示来，也很简单。所以本文着重讲解本地部署的步骤和如何解决会遇到的坑。

官方在线Web App - DreamStudio
- 👍 最易上手，登录即可直接使用
- 👍 可视化调参
- 😡 免费次数有限
Google Colab运行
- 👍 免费，次数无限
- 😥 操作略微繁琐
- 😥 不能持久运行
本地、云服务器部署
- 👍 本地部署免费，次数无限
- 👍 功能完整，可玩性高
- 😥 硬件要求高
- 😥 租用云服务挺贵
- 😥 初次部署较为麻烦

DreamStudio

最简单无脑的上手途径，打开官网，输入一段话，等待结果出来就可以。没啥好说的，适合快速上手体验一下，或者付费玩家。

beta.dreamstudio.ai/dream

Google Colab运行

“Colab”，是 Google Research 团队开发的一款产品。可以通过浏览器编写和执行Python。可以免费分配使用包括 GPU 在内的计算资源。

打开这个Colab笔记本页面，按照步骤和提示执行就OK了。可能存在的坑模型的载入，需要用到Hugging Face ，不过也都不是什么问题。

虽然看着繁琐，但是可以薅羊毛用免费的显卡资源，性能也还不错，还是很香的。 colab.research.google.com/github/hugg…

本地/云服务器部署

目前存在多个基于官方代码仓库fork出来的不同版本，可以有不同的部署和运行方式，包括docker部署，webUI。这里讲解基于官方的原版进行部署和使用，其他的方式都大同小异。

硬件

本地10G显存以上的显卡（显存不够也有其他办法），或租用拥有对应配置的云服务

环境依赖

Python，Conda

具体步骤

1. 下载模型权重文件

这个放在第一位是因为权重文件太大了，建议先下载起来，其他步骤在操作时，他可以在后台慢慢下载。

目前最新的是sd-v1-4.ckpt，版本越高，训练的数据量越大，下载最新版本即可，4.27GB

去huggingface下载：huggingface.co/CompVis/sta…

curl下载：

curl https://www.googleapis.com/storage/v1/b/aai-blog-files/o/sd-v1-4.ckpt?alt=media > sd-v1-4.ckpt

2. 安装python

dddd, 不赘述

3. 安装Conda

Conda 是一个依赖包和环境管理工具，有Anaconda 和 Miniconda两个版本，这里使用Miniconda就可以。

可以官网下载对应的安装包，也可以命令行下载安装。

docs.conda.io/en/latest/m…

如果安装成功，可以通过 conda --version 查看版本，conda准备好就可以进入下一步。

4. 拉取Stable-Diffusion代码库到本地

github.com/CompVis/sta…

git clone https://github.com/CompVis/stable-diffusion.git
cd stable-diffusion/

5. 创建并激活 Conda 环境

a. 创建ldm环境

进入Stable Diffusion代码目录，使用environment.yaml文件，创建Conda环境。

conda env create -f environment.yaml

这个命令会根据environment.yaml文件，创建一个名字叫做ldm的虚拟环境，下载对应的依赖。这一步是很容易出现问题的地方，因为依赖比较多，安装时间比较长。可能会出现某些依赖安装时间特别长，最后失败的情况。

可能出现的问题：

因为过程中会用到pip安装依赖，如果安装依赖时间过长，可以在conda create执行前，先配置pip的国内镜像。根据我实际尝试的情况，建议使用清华镜像，阿里云镜像也很慢。

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

如果出现：Pip subprocess error: ERROR: Command errored out with exit status 128: git fetch -q … 的错误，则检查当前网络环境对github的访问是否通畅。
安装失败尝试再次安装时，可能出现提示环境已存在。这时候可以删掉原来的ldm环境，再重试安装。

# 查看已存在环境
conda env list
# 先切换到base环境
conda activate base
# 删除ldm
conda env remove --name ldm

b. 激活ldm环境

conda activate ldm

6. 生成脚本跑起来！

走完前面这些步骤，确认一下你的模型权重文件下载好了没有，--ckp 参数就指向这个文件。按照下面的参数，执行txt2img.py脚本。

python scripts/txt2img.py --prompt "rainbow ice cream cone" --plms --ckpt sd-v1-4.ckpt --skip_grid --n_samples 1

如果执行成功，你应该可以在output文件夹内找到生成出来的彩色甜筒🍦的图片。

可能出现的问题：

PytorchStreamReader failed reading zip archive
- 模型文件下载不完整，重新下载即可

尝试把 --prompt 参数换成脑洞大开的各种描述词吧。其他参数详情可以参考git主页。github.com/CompVis/sta…

除了文字生成图，还有可以玩图生图。

一些能让图像更加有趣的提示词内容建议：

描述画面里想要存在的元素，物品，情绪
- 森林，秋天，雨水，雾，苔藓，城堡，樱花，海浪，山，神庙
氛围，情绪
- 快乐，阴郁，赛博朋克，霓虹，蒸汽朋克，原子朋克
画风
- 现实，逼真, 油画, 铅笔画, 概念艺术, 超现实，魔法，幻想，中国山水
艺术家
- 达芬奇, 梵高 (油画), 莫兰，莫奈 (风景）,宫崎骏与吉卜力工作室
- Artgerm（漫画精致五官）,Yuko Shimizu（插画）
润色和修饰(一些神奇咒语)
- 虚幻引擎，octane render（3D渲染）, ArtStation, 8k, 4k, washed colors

Ultra realistic photo, princess peach in the mushroom kingdom, beautiful face, intricate, highly detailed, smooth, sharp focus, art by artgerm and greg rutkowski and alphonse mucha