AI 绘画大模型群雄并起，新秀 FLUX.1 来袭，最会画手的 AI 绘画大模型来啦！

最新推荐文章于 2024-09-04 14:34:46 发布

Ai_绘画小南

最新推荐文章于 2024-09-04 14:34:46 发布

阅读量1.7k

点赞数 6

文章标签：人工智能 stable diffusion AIGC

本文链接：https://blog.csdn.net/Java_Joker/article/details/140922117

版权

前言

‍‍‍‍‍前言

最近这几天最火的模型应该就是 FLUX.1 了，由 Stable Diffusion 的原创团队推出的开源 AI 绘画大模型。

相比 SD3 拥有更优秀的提示词理解能力，更强的文字生成功能、更复杂的构图以及人体结构理解能力，以及终于解决了 AI 开源绘画模型被诟病很久的不能生成正常人手的问题。

FLUX.1 包含了三种变体 FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。

FLUX.1 [pro] 效果最好，但是没有开源，只能使用通过 API 接口调用，或者去 FLUX.1 官网体验。

FLUX.1 [dev] 是从 FLUX.1 [pro] 提炼而来，生成图片的质量会有一些影响，但是基本也不太看的出来，不过不支持商用。

FLUX.1 [schnell] 是一个加速版本，只需要 4 步就可以生成图像，效果上就会差些意思，这个是真的差些意思，不过支持商用。

好了，话不多说，我们直接开整。

—

直接来看效果吧：

提示词：filmic photo of a group of three women on a street downtown, they are holding their hands up the camera

来看看 FLUX.1 直出的手，虽然不能说完美吧，但是也挑不出来太多的毛病，这效果真的是相当可以了，终于可以把手大方的露出来了。

提示词：The text "Do one thing at a time,and do well." generated by flowing milk

关于文字的生成，都不需要抽卡，每次生成都是相当的准确。

提示词：A future robot writes ' Do one thing at a time,and do well.' on the blackboard

再来个稍微复杂一些的结合文字的场景，输出也很 OK。

提示词：There is a blue table on the red grass, with four exquisite bottles on it. From left to right, the bottles are labeled with "F", "L", "U", and "X" in sequence

颜色以及空间理解能力也到位。

提示词：cinematic still a tiny astronaut hatching from an egg on the moon . emotional, harmonious, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy

画面的表现力也是相当不错。

提示词：beautiful anime artwork, a cute anime girl’s silhouette, double exposure, iridescent nebula galaxy, black background, ethereal glow, bloom, hdr

提示词：anthropomorphism. Create a portrait of a eagle dressed in 18th-century men's attire. The eagle wears an elaborate, ornate waistcoat, a ruffled cravat, and a classic tricorn hat, all rendered in rich fabrics and intricate patterns. , photography, Natural geographic photo, Hyper-realistic, 16k resolution, (masterpiece, award winning artwork), many details, extreme detailed, full of details, Wide range of colors, high Dynamic,

接下来，我们来看看具体如何使用，ComfyUI 已经原生支持 FLUX.1，所以我们只需要把 ComfyUI 更新到最新版本就可以了，工作流以及模型听雨会放在文末的网盘里，需要的小伙伴可以自取。

模型比较大，dev 和 schnell 模型都有 24G，所以对本地配置的要求也比较高，全量版本 4090 都够呛，但是我们可以使用 FP8 版本，显存大概 16G 的样子。

小伙伴们只需要把网盘中的模型放在在 ComfyUI 模型目录「models」中对应的目录下即可。

网盘中的模型并不需要都下载，clip 中的模型如果之前玩过 SD3 的小伙伴应该是已经下载过的，如果本地有同样的文件那就不需要下载了。

ComfyUI 现在提供了两种模型加载方案，也就是两个不同的工作流来加载 FLUX.1，我们可以选择只下载「checkpoints」中的 fp8 版本的模型，然后用正常模型的加载方式来使用 FLUX.1，和基础文生图工作流稍稍有些区别，CFG 值推荐使用 1.0。

模型大小总共 16G，显存占用大概 14G 的样子。

还有一种是下载「unet」、「vae」、「clip」这三个文件中的模型，并放在指定位置，可以使用全量模型，模型就是有点大，不算 [schnell] 版本，差不多有 30 多个G。

想跑全量，显存起码要大于 24G，官方的意思是需要 32G 显存才可以。

不过这里虽然是全量的模型，但是可以把「weight_dtype」设置为 fp8，也可以实现和第一个工作流相同的效果，如果选择默认那就是全量。

如果都是使用 fp8 的话，这两种模型加载方式的出图效果其实都差不多，显存占用也都一样，所以如果本地配置不够的小伙伴还是建议直接使用第一种就可以了，而且第一种工作流出图速度更快。

好了，今天的分享就到这里了，感兴趣的小伙伴快去试试吧！

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好，需要的点击下方插件，即可前往免费领取！

在这里插入图片描述

Ai_绘画小南

关注

6
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
AI 绘画大模型群雄并起，新秀 FLUX.1 来袭，最会画手的 AI 绘画大模型来啦！

‍‍‍‍‍前言最近这几天最火的模型应该就是 FLUX.1 了，由 Stable Diffusion 的原创团队推出的开源 AI 绘画大模型。相比 SD3 拥有更优秀的提示词理解能力，更强的文字生成功能、更复杂的构图以及人体结构理解能力，以及终于解决了 AI 开源绘画模型被诟病很久的不能生成正常人手的问题。FLUX.1 包含了三种变体 FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。
复制链接

扫一扫