SD原班人马打造最强图片生成模型Flux,群友们直呼再也不用抽盲盒了,Midjourney实测

最近晓薇的AI群都在晒Flux的图片,因此今天我打算分享一下Flux工具的使用体验,用过的都惊叹抽卡效率大大提升了!

概述

近期,黑森林实验室(Black Forest Lab)重磅推出了全新图像生成模型FLUX.1。

三种版本满足不同需求:性能强劲的专业版、开发者版,以及轻巧高效的快速版。

官网Flux模型样张

黑森林实验室由Stable Diffusion原班人马和StabilityAI前研究员联手打造。

团队的核心信念是开发广泛可访问的模型,促进研究界和学术界的创新和协作,并提高模型透明度。

公司刚完成3100万美元的种子轮融资,并计划不久之后发布SOTA视频模型,这将为市场带来新波澜。

本期晓薇主要分享 FLUX.1 的文生图模型,主要体验官方提到的重大突破部分,如文字、手部细节处理等,还和常用的AI绘画模型进行了对比,感兴趣的小伙伴一起来看看呀!

FLUX 模型介绍

FLUX是Black Forest Labs推出的文本到图像合成模型,以其120亿参数的庞大规模,超越了DALL-E 2和Stable Diffusion等其他主流模型的10亿参数规模。

这一扩展使得FLUX在图像生成的质量和多样性上实现了显著提升。

FLUX包含三个版本:

性能领先的专业版(pro)、适合非商业应用的开发者版(dev),以及专为快速本地开发设计的快速版(schnell)。

这些模型不仅在视觉质量、提示遵循和输出多样性等方面设立了新的行业标准,而且部分模型的开源特性进一步推动了技术的普及和创新。

在ELO跑分评测对比中,可以看见Flux模型表现出色

官方提到,FLUX.1 [pro] 和 [dev] 在“视觉质量、提示跟随、大小/纵横比可变性、排版和输出多样性"均超越了 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra

应用示例

晓薇针对部分能力做了输出测试,下面看看测试结果

超强的文字生成能力

一只胖胖的仓鼠,拿着一个我要减肥的牌子

从左至右:专业版、开发版、快速版

多人控制能力

经常抽卡的小伙伴肯定知道在多人情况下,会损失脸部细节,看看Flux的表现吧~

真的很惊艳!

手部细节处理

人手一直是多模态生成模型的重灾区。FLUX.1生成的人手表现也相当惊艳!比如握在一起的手,就能难道不少绘图模型

与MJV6.0的模型对比

2只胖仓鼠励志要减肥提示词:

Two fat hamsters, the black hamster on the left holding the “I want” sign, the white hamster on the right holding the “lose weight” sign. Real photo textures, imaginative images, outdoors, cinematic lighting

两只胖仓鼠,左边的黑仓鼠举着“我要”的牌子,右边的白色仓鼠举着“减肥”的牌子。真实的照片纹理,富有想象力的图像,户外,电影照明

这里测试了语义理解和位置指示;每个主体拿着字的具体文字信息,同样的提示词在Flux模型中效果都能理解正确,但是MJV6.0的文字理解能力不如Flux

Flux,专业版、开发版、快速版

Midjourney

手部油画交叠的手提示词:

eye level,classic oil painting, crossed woman’s hands, red jewel ring on ring finger, ornate frame, frame hanging on dark green wall, white slip of paper on right side of frame,“From Flux”

眼睛水平,经典的油画,交叉的女人的手,无名指上的红色珠宝戒指,华丽的框架,画框挂在黑暗的绿色墙上,框架右侧的白色纸条,“From Flux”

这里测试了手的处理细节,语义理解能力,还有文字处理能力,还挑选了MJ生成不错的图,但依然还是Flux略胜一筹

Flux,专业版、开发版、快速版

Midjourney

版本选择

版本介绍

FLUX.1共有专业版、开发版、快速版

FLUX.1 [pro]

FLUX.1[pro]是最先进的一个版本,这个版本提供最先进的性能图像生成,具有顶级的提示跟踪、视觉质量、图像细节和输出多样性。并且官方团队还在增加 API 中 FLUX.1 [pro] 的推理计算。

FLUX.1 [dev] 开发版

用于非商业应用。FLUX.1 [dev] 直接从 FLUX.1 [pro] 提炼而来,具有相似的质量和能力,同时比相同尺寸的标准模型效率更高。

FLUX.1 [schnell]

这是最快的模型是为本地开发和个人使用者量身定制的。FLUX.1 [schnell] 在 Apache2.0 许可下公开可用。

三款模型的价格依次为每张图片0.055美元、0.03美元、0.003美元(约合人民币0.4元、0.22元、0.022元)。

版本价格

Flux有2个合作伙伴, Replicate 和 fal.ai ,收费方式不一样(文末有不同价格的产品体验直达链接)

专业版:

Replicate:0.055 美元/张,按生成的图像数量定价

fal.ai:每百万像素 0.05 美元,1 美元,可运行此模型大约 20 次

开发版:

Replicate:0.03 美元/张

fal.ai:每百万像素 0.025 美元,1 美元,可以运行此模型大约 40 次

快速版:

Replicate:0.003 美元/张,

fal.ai:每百万像素 0.003 美元,1 美元,可以运行此模型大约 333 次

未来展望

上面晓薇测试了不少图了,质量真的很棒,这就更期待黑森林实验室的视频模型(SOTA)了~

未来将进一步拓展FLUX.1的应用场景和能力,该模型将建立在FLUX.1的基础上,以高清和前所未有的速度实现精确创作和编辑!

如何使用

使用很简单,直接打开网页输入提示词就可以了(其他默认就好了),上面提到有2个合作方,默认的操作界面稍微不一样,小伙伴们随意挑选就好,体验下来,3个版本的生成速度都超级快~

合作方 replicate 默认操作界面

合作方fal.ai 默认操作界面

写在最后

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除
  • 8
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值