Stable Diffusion 3.5 震撼发布!最新开源 AI 图像生成模型,艺术创作必备神器!

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. Stable Diffusion 3.5 是 Stability AI 的最新图像生成模型,包括 Large、Large Turbo 和 Medium 版本。
  2. 模型具有高效性能和可定制性,支持多样化输出和多种风格。
  3. 适用于艺术创作、游戏开发、广告营销等多种应用场景。

正文(附运行示例)

Stable Diffusion 3.5 是什么

在这里插入图片描述

Stable Diffusion 3.5 是 Stability AI 公司最新推出的一系列先进的 AI 图像生成模型,包括 Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo 和即将发布的 Stable Diffusion 3.5 Medium。这些模型以其高度的可定制性、在消费级硬件上的运行能力及在 Stability AI 社区许可证下的免费商业和非商业用途受到广泛关注。

Stable Diffusion 3.5 的主要功能

  • 模型版本多样化:提供 Large、Large Turbo 和 Medium 三种版本,满足不同需求。
  • 高效性能:优化后能在标准消费级硬件上运行,降低使用门槛。
  • 可定制性:灵活的构建基础,便于微调和定制应用。
  • 多样化输出:能生成代表全世界的图像,提升多样性和包容性。
  • 风格多样:支持 3D、摄影、绘画等多种视觉风格。
  • 优化的算法效率:降低对计算资源的需求,提高运行效率。
  • 更好的稳定性和可扩展性:引入 Query-Key Normalization 技术,提升训练稳定性和可扩展性。
  • 高质量的提示词理解:更准确地理解提示词并生成匹配图像。

Stable Diffusion 3.5 的技术原理

  • 文本到图像的生成:利用深度学习模型,特别是变分自编码器(VAE)和生成对抗网络(GAN),将文本提示转换成图像。
  • 多模态学习:结合文本编码器(如 OpenAI CLIP-L/14、OpenCLIP bigG、Google T5-XXL)理解文本提示。
  • MM-DiT:核心是一个全新的多模态扩散变换器,用于生成图像。
  • 优化的架构:基于改进的 MMDiT-X 架构和训练方法,优化图像质量和生成速度。
  • 定制和微调:使用 Query-Key Normalization,简化微调过程。

如何运行 Stable Diffusion 3.5

安装

python3 -s -m venv .sd3.5
source .sd3.5/bin/activate
python3 -s -m pip install -r requirements.txt

运行

# 生成一只猫的图像
python3 sd3_infer.py --prompt "cute wallpaper art of a cat"
# 使用文本文件中的提示词列表
python3 sd3_infer.py --prompt path/to/my_prompts.txt
# 使用SD3.5 Large Turbo模型
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3.5_large_turbo.safetensors
# 使用SD3 Medium模型
python3 sd3_infer.py --prompt path/to/my_prompts.txt --model models/sd3_medium.safetensors

文件指南

  • sd3_infer.py:入口文件,用于基本的使用。
  • sd3_impls.py:包含 MMDiTX 和 VAE 的封装。
  • other_impls.py:包含 CLIP 模型、T5 模型和一些工具。
  • mmditx.py:包含 MMDiT-X 的核心代码。
  • models文件夹:包含所需的模型文件。

资源


❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

### Stable Diffusion 3.5 安装指南与使用教程 #### 一、简介 Stable Diffusion 3.5 是一款强大的 AI 文本生成图像模型,现已免费开源并提供详细的本地安装和在线使用教程[^1]。 #### 二、下载地址 对于希望部署于本地环境的用户而言,可以前往 Hugging Face 平台获取 `Stable Diffusion 3.5 Large` 版本的下载链接:[Hugging Face](https://huggingface.co/stabilityai/stable-diffusion-3.5-large)。 #### 三、依赖项准备 在开始之前,请确认已准备好如下工具链: - Python (建议版本 >= 3.8) - PyTorch 及其对应的 CUDA 扩展库(如果计划利用 GPU 加速) - Git 工具用于克隆项目仓库 #### 四、快速启动命令行界面(CLI) 为了简化初次使用者的学习曲线,官方提供了简易版 CLI 接口供测试之用。通过简单的几条指令即可完成基本配置与图片创作尝试: ```bash git clone https://github.com/Stability-AI/generative-models.git cd generative-models pip install -r requirements.txt python scripts/txt2img.py \ --plms \ --outdir outputs/ ``` 上述脚本会基于给定提示语(`prompt`)自动生成一张描述为“专业的猫咪照片”的艺术作品,并保存至指定目录下(outputs/)。 #### 五、WebUI图形化操作面板 除了命令行方式外,更推荐新手采用 Web 用户接口(Web UI),它允许拖拽文件上传以及直观调整参数设置等功能特性。具体搭建流程可参照官方文档说明页面中的指导步骤进行。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值