刚刚,Stable Diffusion 3.5重磅开源,文生图模型霸主归来!

著名大模型开源平台Stability AI,开源了超强文生图模型——Stable Diffusion 3.5。

Stable Diffusion 3.5一共有Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。

开源地址:https://huggingface.co/stabilityai

Github:https://github.com/Stability-AI/sd3.5

今年6月Stability AI首次开源了Stable Diffusion 3 Medium,但效果未达到预期,在听取了社区用户的反馈后,Stability AI花费大量时间进一步开发,便有了最新的3.5版本。
这份完整版的AI绘画(SD、comfyui、AI视频)整合包已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Large、Turbo、Medium简单介绍

在这次发布中,Stable Diffusion 3.5提供了多种模型,以满足不同用户群体的需求。Stable Diffusion 3.5 Large模型拥有80亿参数,提供了卓越的图片质量和高度文本语义还原,是Stable Diffusion家族中最强大的模型,非常适合专业使用,尤其是在100万像素分辨率的图片。

而Stable Diffusion 3.5 Large Turbo模型则是一个蒸馏版本,它能够在仅仅4步之内生成高质量的图像,并且对提示的遵循性非常好,速度比Stable Diffusion 3.5 Large快得多。

Stable Diffusion 3.5 Medium模型将在10月29日发布,这个模型有25亿参数,采用了改进的MMDiT-X架构和训练方法,能在消费级硬件上即开即用,可生成0.25—200万像素之间生成图像,兼顾了质量和易定制性。

在开发这些模型的过程中,Stability AI优先考虑了可定制性,提供了一个灵活的基础来构建。

将Query-Key归一化集成到了变换器块中,这不仅稳定了模型训练过程,还简化了进一步的微调和开发。

为了支持这种下游的灵活性,Stability AI不得不做出一些权衡,例如,同一个提示使用不同种子可能会产生更大的输出变化,这是有意为之的,以帮助在基础模型中保留更广泛的知识库和多样化的风格。

此外,Stable Diffusion 3.5在可定制性、高效的性能以及多样化的输出方面表现出色,使其成为市场上最可定制和最易访问的文生图像模型之一,同时在提示遵循性和图像质量方面保持了顶级性能。

这份完整版的AI绘画(SD、comfyui、AI视频)整合包已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

### Stable Diffusion 3.5 安装指南与使用教程 #### 一、简介 Stable Diffusion 3.5 是一款强大的 AI 文本生成图像模型,现已免费开源并提供详细的本地安装和在线使用教程[^1]。 #### 二、下载地址 对于希望部署于本地环境的用户而言,可以前往 Hugging Face 平台获取 `Stable Diffusion 3.5 Large` 版本的下载链接:[Hugging Face](https://huggingface.co/stabilityai/stable-diffusion-3.5-large)。 #### 三、依赖项准备 在开始之前,请确认已准备好如下工具链: - Python (建议版本 >= 3.8) - PyTorch 及其对应的 CUDA 扩展库(如果计划利用 GPU 加速) - Git 工具用于克隆项目仓库 #### 四、快速启动命令行界面(CLI) 为了简化初次使用者的学习曲线,官方提供了简易版 CLI 接口供测试之用。通过简单的几条指令即可完成基本配置与图片创作尝试: ```bash git clone https://github.com/Stability-AI/generative-models.git cd generative-models pip install -r requirements.txt python scripts/txt2img.py \ --plms \ --outdir outputs/ ``` 上述脚本会基于给定提示语(`prompt`)自动生成一张描述为“专业的猫咪照片”的艺术作品,并保存至指定目录下(outputs/)。 #### 五、WebUI图形化操作面板 除了命令行方式外,更推荐新手采用 Web 用户接口(Web UI),它允许拖拽文件上传以及直观调整参数设置等功能特性。具体搭建流程可参照官方文档说明页面中的指导步骤进行。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值