前言
Flux是一个由黑森林实验室(Black Forest Lab)推出的模型,开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下:
-
参数规模大****:官方号称模型有12B(120亿)参数,是迄今为止最大的开源文本到图像模型之一。在视觉质量、提示词遵循、大小/纵横比可变性、字体和输出多样性等方面超越了其他流行的模型。
-
针对不同需求的多种模型:提供三种不同性能和用途的变体,包括专业版(FLUX.1 [pro])、开发版(FLUX.1 [dev])和快速版(FLUX.1 [schnell])。
-
技术层面提升:引入了流匹配训练方法、旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。
-
对文字的写入:可以将文字写入图片中,成为图片的一部分。
Flux的官方介绍如下:
所有的AI设计工具,模型和插件,都已经整理好了,👇获取~
官方示例:
把 Markdown 文本粘贴到这里,点上面的按钮,就可以开始一键转换了,可以选择带时间模块,也可以不带。
_1_
先说结论
非常强大
要用一个短语总结只有“非常强大”四个字。在刚出来的时候很多人的评价就是拳打Stable Diffusion3,脚踢Midjourney,在使用过后我觉得毫不夸张。有几个非常值得注意的点:
图片有非常好的精神和虚化效果
全图中背景虚化以达到景深的感觉,对人物的刻画细节满满。
人物的手指非常清晰且无需修正
实际上对于人物手指的刻画,基本上没有出过错
线条非常漂亮,没有弯曲的迹象
图片提示词没写好,出图很模糊,但是可以看出窗户等是规规整整的,没有扭曲变形。
2
如何使用Flux
1、非自部署需要使用ComfyUI
对于非开发者或者开发能力不强的人来说,直接使用ComfyUI是比较好的选择。
**2、使用相应的工作流和权重模型
**
Flux需要对应使用其vae编码器/解码器,clip模型使用t5xxl_fp16.safetensors,具体可见工作流。
3、ComfyUI工作流
默认提供下载的工作流比较繁琐,可以考虑自己重新搭建,主要为大模型加载器、vae加载器、clip加载器(需要单独加载)、Ksampler采样器和最后的预览。
4、硬件要求
Flux对硬件要求很高,官方推荐是12g显存,这个数字一般只有笔记本/台式机4080或者以上显卡能达到(魔改的2080不算),但是实际测试下来,我的3070 8g的显存也能跑起来,但是内存却吃掉了16g,同时CPU也跑满了,出一个1024X1024的图大概需要3~5分钟,512X768的大概1分钟。
5、出漂亮图的重点
提示词非常重要,建议使用长句式。另外采样器和调度器在一定程度上会决定出图的风格与颜色艳丽程度。一般情况下使用Eular a祖先采样器+Karras或者DPM 2M++等效果还不错。
3
模型能力对比
这里列出Flux和其他几个模型的对比能力
模型对比有一定的主观性
这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。
有需要的朋友,可以点击下方免费领取!
AIGC所有方向的学习路线思维导图
这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
AIGC工具库
AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
有需要的朋友,可以点击下方卡片免费领取!
精品AIGC学习书籍手册
书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。
AI绘画视频合集
我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。