Stable Diffusion 3.5(SD3.5)是一款轻量级的推理参考实现,它支持使用SD3/SD3.5模型进行简单的图像生成。这个模型不包含权重文件,但提供了文本编码器和核心MM-DiT技术,使得图像生成变得更加便捷和高效。
特点
SD3.5的亮点包括:
- 支持多种文本编码器,如OpenAI CLIP-L/14、OpenCLIP bigG、Google T5-XXL。
- 包含VAE Decoder,类似于之前的SD模型,但具有16个通道且没有后量化卷积步骤。
- 核心MM-DiT技术是全新的,为图像生成提供了强大的支持。
安装和使用
安装
在Linux或Mac系统上,你可以按照以下步骤安装SD3.5:
bash
python3 -s -m venv .sd3.5
source .sd3.5/bin/activate
# 在Windows系统上,使用:
# venv\scripts\activate
python3 -s -m pip install -r requirements.txt
运行
使用SD3.5生成图像非常简单。以下是一些基本的命令示例:
- 使用SD3.5 Large模型生成图像(默认设置):
bash
python3 sd3_infer.py --prompt "cute wallpaper art of a cat"
- 使用文本文件中的提示列表生成图像:
bash
python3 sd3_infer.py --prompt