要说2024年AI绘画界最火、最有潜力的开源大模型是谁,那非 FLUX莫属!
首先来看一下用相同的提示词,在SD1.5、SDXL、SD3和Flus中的出图效果,明显能看出Flux的效果更佳。
提示词:``画质:最高质量,真实照片风格,``人物:一位身穿亮蓝色连衣裙的年轻女性``细节:细节眼睛,精致的脸,毛孔细节,细节眼睛、瞳孔、虹膜、精致的嘴唇,美丽的脸,戴着一条项链,为现场增添了一丝优雅,``环境:站在一群人包围的聚会上,周围灯火通明,``出图尺寸:1280x768``采样方法:euler + simple``采样步数:20``引导系数:7``CLIP SKIP:2
Flux的效果之所以这么出众,和它的训练参数多达120亿分不开,单个模型就能达到非常恐怖的22GB(电脑硬盘又不够用了)。
一、Flux的优点
**1、画面效果好。**仅凭借提示词,就可以生成以假乱真的画面,这绝对是所有开源大模型里面最强的存在。无论画质、细节、质感,都非常惊艳。
**2、攻克了AI画手的难题。**无论是动漫风格还是真人风格,手部的细节都刻画的非常好。
**3、输出文字方面的功能出乎意料。**只要你的提示词足够详细,你可以在任意场景中表达任意文字。虽然现在还不支持中文,但想必不久的将来肯定会支持的。
4、训练参数大,风格样式多。
在一般的情况下,不需要下载很多风格的大模型,只需要一个底模 ,就可以轻松驾驭不同风格的创意绘画。
5、出图弹性大。
Flux出图对提示词和分辨的要求都大大降低了。
例如不再需要输入负面提示词,针对不同的模型也不需要谨慎的去选择不同的出图尺寸了。
二、Flux衍生出的各种模型
黑森林官方共推出了三款Flux模型,分别是Pro、DEV、Schnell
1、Pro版仅支持API调用,正常情况下我们能使用到的最好的版本就是DVE版本。
2、DEV版FP16效果最好,但显卡在90系列以下的同学就不要考虑了。如果没有顶配显卡,可以考虑容量只有一半的FP8版本。FP16和FP8出图的效果差别不大,只会在非常细节的地方有所差异,而这些差异可能不仔细看你都看不出来。
3、Schnell版相当于DVE版的加速版,它可以把采样步数从20步降低到4-8步,大大降低了出图的等待时间,但出图效果也会相对差一点。不过出图效果依旧很棒。
但即使最快最小的Schnell的FP8版,显存占用也达到了14GB以上。
4、更快的GGUF版。
GGUF是把Flux拆成了不同尺寸的小模型,从Q 2-Q8容量递增,你可以根据自己的显卡选择合适的版本。
**5、NF4版。**它整合了VAE和T5文本编码器,所以它的容量更大一些,达到了11GB,使用它也需要最低8G的显卡显存。
下面是Flux各版本的出图效果对比。
END
这里直接将该软件分享出来给大家吧~
1.stable diffusion安装包
随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。
最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本。
2.stable diffusion视频合集
我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。
3.stable diffusion模型下载
stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。
4.stable diffusion提示词
提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。
5.SD从0到落地实战演练
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。
这份完整版的stable diffusion资料我已经打包好,需要的点击下方插件,即可前往免费领取!