2024年10月22号,Stability AI 推出 Stable Diffusion 3.5。这是Stability AI 迄今为止最强大的模型。
此开放版本包含多个可定制的变体,可在消费级硬件上运行,并可在宽松的Stability AI 社区许可证下使用。现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型,并在 GitHub 上下载推理代码。
Stable Diffusion 3.5 体现了Stability AI 致力于为开发者和创作者提供广泛可用、先进且在大多数情况下免费的工具的承诺。鼓励在整个流程中分发和货币化工作 - 无论是微调、LoRA、优化、应用程序还是艺术作品。
关键要点:
-
此公开版本包含多个型号变体,包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5Large Turbo。此外,Stable Diffusion 3.5 Medium 将于 10 月 29 日发布。
-
这些模型的尺寸可高度定制,可在消费级硬件上运行,并且根据宽松的Stability AI 社区许可,可免费用于商业和非商业用途。
-
现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion3.5 Large Turbo ,并在GitHub 上下载推理代码。
具体细节
Stable Diffusion 3.5 提供了多种模型,旨在满足科学研究人员、业余爱好者、初创企业和企业的需求:
Stable Diffusion 3.5 Large:该基础型号拥有 80 亿个参数,质量卓越,响应迅速,是 Stable Diffusion 系列中最强大的型号。该型号非常适合 1 百万像素分辨率的专业用例。
稳定扩散 3.5 Large Turbo:稳定扩散 3.5 Large 的精简版仅需 4 个步骤即可生成高质量图像,且具有出色的快速依从性,速度比稳定扩散 3.5 Large 快得多。
Stable Diffusion 3.5 Medium(将于 10 月 29 日发布): 该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,可在消费级硬件上“开箱即用”,在质量和定制易用性之间取得平衡。它能够生成分辨率在 0.25 到 2 百万像素之间的图像。
开发模型
在开发模型时,优先考虑可定制性,以提供灵活的构建基础。为了实现这一点,将查询键规范化集成到转换器块中,稳定了模型训练过程并简化了进一步的微调和开发。
为了支持这种下游灵活性,必须做出一些权衡。使用不同种子的同一提示可能会产生更大的输出差异,这是有意为之,因为它有助于在基础模型中保留更广泛的知识库和多样化的风格。然而,结果,缺乏特异性的提示可能会导致输出的不确定性增加,并且美学水平可能会有所不同。
具体来说,对于 Medium 模型,对架构和训练协议进行了一些调整,以提高质量、连贯性和多分辨率生成能力。
模型的优势
Stable Diffusion 3.5 版本在以下方面表现出色,使其成为市场上最可定制、最易于访问的图像模型之一,同时在及时性和图像质量方面保持顶级性能:
可定制性: 轻松微调模型以满足您的特定创作需求,或根据定制的工作流程构建应用程序。
高效性能: 经过优化,可在标准消费硬件上运行,无需繁重工作,尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。
多样化输出: 创建代表世界的图像,而不仅仅是一种类型的人,具有不同的肤色和特征,无需大量提示。
在这里插入图片描述
风格多样: 能够生成各种风格和美感,如 3D、摄影、绘画、线条艺术以及几乎任何可以想象的视觉风格。
此外,Stable Diffusion 3.5 Large在及时遵守方面处于市场领先地位,并且在图像质量方面可与更大的型号相媲美。
Stable Diffusion 3.5 Large Turbo提供了同类模型中最快的推理时间,同时在图像质量和及时性方面保持了高度竞争力,即使与类似尺寸的非蒸馏模型相比也是如此
Stable Diffusion 3.5 Medium 的表现优于其他中型型号,在迅速遵守和图像质量之间实现了平衡,使其成为高效、高质量性能的首选。
Stability AI 相关费用
根据宽松社区许可证发布此模型。以下是许可证的关键组成部分:
**非商业用途免费:**个人和组织可以免费将该模型用于非商业用途,包括科学研究。
**免费用于商业用途(年收入最高 100 万美元):**初创企业、中小型企业和创作者可以免费将该模型用于商业用途,只要他们的年总收入低于 100 万美元。
**输出所有权:**保留所产生的媒体的所有权,不受限制性许可的影响。
对于年收入超过 100 万美元的组织,请咨询企业许可证。
访问模型的更多方式
虽然模型权重现在可以在 Hugging Face 上自托管,但您也可以通过以下平台访问该模型:
稳定性AI API :API使用参考
在线网站:https://replicate.com/stability-ai/stable-diffusion-3.5-large
工作流模式:https://blog.comfy.org/sd3-5-comfyui/
DeepInfra:deepinfra网站
官网博客:https://stability.ai/news/introducing-stable-diffusion-3-5