2024年AI绘画界最火、最有潜力的开源大模型FLUX来了!由Stable Diffusion原班人马打造,视觉质量、提示词遵循、风格多样性上表现卓越。本文5分钟带你全面了解FLUX,从基础概念到与Stable Diffusion的对比,再到实战教程,助你快速掌握AI绘画新趋势
首先来看一下用相同的提示词,在SD1.5、SDXL、SD3和Flus中的出图效果,明显能看出Flux的效果更佳。
提示词:画质:最高质量,真实照片风格,人物:一位身穿亮蓝色连衣裙的年轻女性细节:细节眼睛,精致的脸,毛孔细节,细节眼睛、瞳孔、虹膜、精致的嘴唇,美丽的脸,戴着一条项链,为现场增添了一丝优雅,环境:站在一群人包围的聚会上,周围灯火通明,出图尺寸:1280x768采样方法:euler + simple采样步数:20引导系数:7CLIP SKIP:2
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
这份完整版的SD全套资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
Flux的效果之所以这么出众,和它的训练参数多达120亿分不开,单个模型就能达到非常恐怖的22GB(电脑硬盘又不够用了)。
一、Flux的优点
**1、画面效果好。**仅凭借提示词,就可以生成以假乱真的画面,这绝对是所有开源大模型里面最强的存在。无论画质、细节、质感,都非常惊艳。
**2、攻克了AI画手的难题。**无论是动漫风格还是真人风格,手部的细节都刻画的非常好。
**3、输出文字方面的功能出乎意料。**只要你的提示词足够详细,你可以在任意场景中表达任意文字。虽然现在还不支持中文,但想必不久的将来肯定会支持的。
4、训练参数大,风格样式多。
在一般的情况下,不需要下载很多风格的大模型,只需要一个底模 ,就可以轻松驾驭不同风格的创意绘画。
5、出图弹性大。
Flux出图对提示词和分辨的要求都大大降低了。
例如不再需要输入负面提示词,针对不同的模型也不需要谨慎的去选择不同的出图尺寸了。
二、Flux衍生出的各种模型
黑森林官方共推出了三款Flux模型,分别是Pro、DEV、Schnell
1、Pro版仅支持API调用,正常情况下我们能使用到的最好的版本就是DVE版本。
2、DEV版FP16效果最好,但显卡在90系列以下的同学就不要考虑了。如果没有顶配显卡,可以考虑容量只有一半的FP8版本。FP16和FP8出图的效果差别不大,只会在非常细节的地方有所差异,而这些差异可能不仔细看你都看不出来。
3、Schnell版相当于DVE版的加速版,它可以把采样步数从20步降低到4-8步,大大降低了出图的等待时间,但出图效果也会相对差一点。不过出图效果依旧很棒。
但即使最快最小的Schnell的FP8版,显存占用也达到了14GB以上。
4、更快的GGUF版。
GGUF是把Flux拆成了不同尺寸的小模型,从Q 2-Q8容量递增,你可以根据自己的显卡选择合适的版本。
**5、NF4版。**它整合了VAE和T5文本编码器,所以它的容量更大一些,达到了11GB,使用它也需要最低8G的显卡显存。
下面是Flux各版本的出图效果对比。
下期我们将一起了解如何安装和部署Flux。
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。