Sana - 比FLUX快100倍！英伟达联手MIT、清华开源超快AI图像生成模型本地一键整合包下载

昨日之日2006

于 2025-01-20 17:00:54 发布

阅读量295

点赞数 7

分类专栏： ai绘画文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yihuaixu/article/details/145265948

版权

ai绘画专栏收录该内容

15 篇文章

订阅专栏

Sana 是英伟达与麻省理工学院、清华大学的研究人员合作开发的全新文本到图像生成框架，该框架能够高效生成高达4096×4096分辨率的图像。

Sana 可以在极快的速度下合成高分辨率、高质量且与文本高度一致的图像，甚至可以在笔记本电脑的GPU上运行。 Sana-0.6B 在性能上与大型扩散模型（如 Flux-12B）不相上下，但模型规模却小20倍，速度快100多倍。

此外，Sana-0.6B 可以部署在16GB 的笔记本电脑 GPU 上，生成1024×1024分辨率的图像只需不到1秒钟，Sana 使低成本的内容创作成为可能。

Sana 的主要优势在于其高效性。在4K 图像生成方面，Sana-0.6B 的吞吐量比目前最先进的方法（FLUX）快100多倍，在1K 分辨率下快40倍。Sana采用了深度压缩自编码器和线性扩散变换器，提升了生成速度和质量，并支持多种语言提示，方便用户创作。

研究人员还对 Sana-0.6B 进行了量化，并将其部署在边缘设备上。在配备 RTX-4090GPU 的消费级设备上，生成1024×1024分辨率的图像只需0.37秒，为实时图像生成提供了强大的基础模型。

今天分享的WebUI是基于Sana-1.6B模型，最大支持2048*2048高分辨率图像生成，且支持批量生成。

SANA生成案例：

使用教程：（建议N卡，显存12G起）
输入提示词（支持中文），设置参数，生成即可。
支持批量生成，为每次生成设置不同的提示词和参数，添加到队列，最后生成队列即可。

一键包下载：私信或下方评论领取

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。