Sana - 比FLUX快100倍!英伟达联手MIT、清华开源超快AI图像生成模型 本地一键整合包下载

Sana 是英伟达与麻省理工学院、清华大学的研究人员合作开发的全新文本到图像生成框架,该框架能够高效生成高达4096×4096分辨率的图像。


Sana 可以在极快的速度下合成高分辨率、高质量且与文本高度一致的图像,甚至可以在笔记本电脑的GPU上运行。 Sana-0.6B 在性能上与大型扩散模型(如 Flux-12B)不相上下,但模型规模却小20倍,速度快100多倍。   

此外,Sana-0.6B 可以部署在16GB 的笔记本电脑 GPU 上,生成1024×1024分辨率的图像只需不到1秒钟,Sana 使低成本的内容创作成为可能。

Sana 的主要优势在于其高效性。 在4K 图像生成方面,Sana-0.6B 的吞吐量比目前最先进的方法 (FLUX) 快100多倍,在1K 分辨率下快40倍。Sana采用了深度压缩自编码器和线性扩散变换器,提升了生成速度和质量,并支持多种语言提示,方便用户创作。   


研究人员还对 Sana-0.6B 进行了量化,并将其部署在边缘设备上。在配备 RTX-4090GPU 的消费级设备上,生成1024×1024分辨率的图像只需0.37秒,为实时图像生成提供了强大的基础模型。


今天分享的WebUI是基于Sana-1.6B模型,最大支持2048*2048高分辨率图像生成,且支持批量生成。

SANA生成案例:




使用教程:(建议N卡,显存12G起)
输入提示词(支持中文),设置参数,生成即可。
支持批量生成,为每次生成设置不同的提示词和参数,添加到队列,最后生成队列即可。

一键包下载:私信或下方评论领取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值