Stable Diffusion 是一种强大的文本到图像生成模型,由于其开源特性,用户可以在本地计算机上进行安装和使用。下面是一个精简的 5 分钟快速指南,帮助您在本地安装 Stable Diffusion。为了确保顺利操作,您需要具备一定的计算机基础知识,并预先安装 Python 和 Git。
安装前的准备
- 确保系统要求:
- 您需要一台安装了 NVIDIA 显卡的计算机(最好支持 CUDA,至少 6GB 显存)。
- 操作系统:Windows、Linux(Ubuntu)或 macOS。
- 安装好 Python 3.8 及以上版本(推荐使用 Anaconda 或 Miniconda)。
- 安装 Git。
安装步骤
1. 克隆 Stable Diffusion 仓库
打开命令行终端,输入以下命令以克隆 Stable Diffusion 的 GitHub 仓库:
git clone https://github.com/CompVis/stable-diffusion
cd stable-diffusion
2. 设置 Conda 环境(可选但推荐)
如果您使用 Anaconda,可以创建一个新的 Conda 环境:
conda create -n ldm python=3.8
conda activate ldm
3. 安装依赖项
使用以下命令安装所需的 Python 包:
pip install -r requirements.txt
如果您在安装时遇到问题,可以尝试使用以下命令更新 pip
和安装额外的库:
pip install --upgrade pip
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
pip install transformers
确保安装时与您的 CUDA 版本(显卡驱动)匹配。
4. 下载模型权重
从 Hugging Face 下载预训练模型权重。您需要一个 Hugging Face 的账户并生成一个访问令牌。然后运行以下命令:
mkdir -p models/ldm/stable-diffusion-v1
curl -L -o models/ldm/stable-diffusion-v1/model.ckpt <YOUR_HUGGINGFACE_MODEL_CHECKPOINT_URL>
请将 <YOUR_HUGGINGFACE_MODEL_CHECKPOINT_URL>
替换为Stable Diffusion模型权重的下载链接。
5. 生成图像
在安装完必要的依赖项之后,您可以通过运行以下命令生成图像:
python scripts/txt2img.py --prompt "A fantasy landscape" --plms
这将生成一个描述为“A fantasy landscape”的图像。
6. 其他参数设置
您可以在命令行中使用其他参数进行自定义调整。例如,设置图像的数量、分辨率等:
python scripts/txt2img.py --prompt "A fantasy landscape" --plms --n_samples 3 --H 512 --W 512
注意事项
- 确保您的 GPU 驱动和 CUDA 版本与 PyTorch 相兼容。
- 如果您在安装过程中遇到任何问题,可以查看 GitHub 仓库的 Issues 部分,寻找解决方案。
小结
通过以上步骤,您已经在本地计算机上成功安装了 Stable Diffusion 模型,并生成了图像。您可以根据需求修改输入的提示词和其他参数来探索不同的图像生成效果。希望这份指南能帮助您快速上手,如果您有任何问题或需要进一步的帮助,欢迎随时询问!