Flux1.1:掀起AI文生图风暴,一键生成照片级真实图像

在人工智能领域,文本生成图像(Text-to-Image)技术日益成熟,最近发布的Flux1.1模型更是引发了广泛关注,迅速在各大社交媒体平台上刷屏。这个模型以其强大的图像生成能力和一个简单易用的技巧,让生成的图像几乎无法与真实照片区分开来。通过模仿单反相机的文件命名格式,用户能够生成看似由真实相机拍摄的高质量图像,无论是人物肖像还是自然风景,都能达到照片级的真实感。

图片

评论区的网友们纷纷表达了对这一技巧的惊叹,不少人表示:“我完全分不清这到底是AI生成的还是实际拍摄的!”这个小技巧的使用非常简单,只需要在提示词中加入某些知名相机的文件格式。

图片

例如,佳能相机的原始图像文件格式为“CR2”,如果输入“IMG”加上随机编号,例如“IMG_1018.CR2”,再加上需要生成的图像内容描述,系统就会生成一张具有高度写实感的图像。

图片

许多尝试过的用户反馈,其他品牌的相机文件格式同样有效,例如索尼的“ARW”、尼康的“NEF”以及苹果设备常用的“HEIC”,这些格式在提示词中的使用,也能显著提升生成图像的逼真度。

图片

对于这种现象,不少网友甚至怀疑,这是不是AI模型在生成图像时,可能随机从训练数据中输出了一张真实的照片?

图片

然而,虽然这些图像看起来非常逼真,但如果放大查看一些特定细节,比如车牌号或文字信息,还是能发现明显的AI生成痕迹。例如,车牌上的字母和数字通常是乱码,这显示出AI在生成这些细节时依然存在技术局限。

图片

这种技巧的效果是否仅仅是因为文件格式的变化,还是说Flux1.1本身的图像生成能力已经十分强大?对此,一位资深的修图师进行了测试,并分享了对比结果。在他的对比图中,左侧为使用了“IMG_1018.CR2”文件格式的生成图像,右侧则是不加任何文件格式的图像。经过对比,他认为两者在真实感上的差异是巨大的,添加了文件格式后的图像更具照片的质感和氛围。

图片

图片

我们也通过实测验证了这一技巧的有效性。在我们的测试中,使用该技巧确实能够显著提升图像的真实感。

现在想免费试玩这个Flux1.1模型,可以来到together.ai平台,注册即送5美元的积分。

图片

比如,当我们生成一张游客在长城上的自拍照时,虽然图像乍一看非常逼真,但仔细观察人物的皮肤质感、背景中的山脉和植被,依然能察觉到一些“AI味”。

图片

然而,当我们将提示词改为“IMG_0314.CR2: selfie on The Great Wall”,生成的图像立刻变得更加真实,特别是在细节处理上,更加接近真实拍摄的照片。

图片

代号蓝莓,最新SOTA文生图模型

随着Flux1.1模型的发布,代号“蓝莓”的神秘模型也终于揭晓。此前,这款模型在各大文生图排行榜上屡次登顶,备受瞩目。Flux1.1以其卓越的性能和价格优势超越了同类竞争对手。

图片

在Artificial Analysis Image Arena上,Flux1.1以“blueberry”的代号,获得了最高的Elo评分

图片

超过了包括Midjourney、Stable Diffusion 3(SD3)、以及Ideogram等其他流行模型。

图片

图片

除了在图像质量上占据优势,Flux1.1 [pro]的生成速度也得到了显著提升。据官方数据,该模型的生成速度比前代FLUX.1 [pro]提升了6倍,而后者在其最近的更新中也实现了速度翻倍。更令人期待的是,Flux1.1 [pro]还将在不久后支持快速高分辨率图像生成,能够在不影响生成速度和指令响应的情况下,直接生成2K分辨率的图像。这种能力将在图像创作和设计领域产生深远的影响,尤其是在需要高精度图像的商业和创意工作中。

Flux1.1模型目前已经通过多个在线平台提供,包括Together.ai、Replicate、fal.ai和Freepik等,用户可以轻松访问并体验它的强大功能。同时,官方还推出了BFL API,供其他开发者将该模型集成到自己的应用程序中。API的定价方案也非常灵活,从FLUX.1 [dev]版本的每张图像2.5美分(约人民币0.18元),到专业版FLUX1.1 [pro]每张图像4美分(约人民币0.28元),价格亲民且适合各种应用场景。​

Stable Diffusion原班人马打造

值得一提的是,Flux1.1 [pro]的研发团队正是大名鼎鼎的Stable Diffusion原班人马。

图片

Robin Rombach

这个团队最初隶属于德国慕尼黑大学的机器视觉与学习研究小组,由Björn Ommer教授带领,团队成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。

图片

在Stability AI的支持下,他们完成了多项重要研究,包括广受好评的Stable Diffusion系列模型。2022年,随着Stability AI的加入,这些核心团队成员进一步推动了文本到图像生成技术的发展。

今年三月份,这些核心成员集体离开Stability AI,并组建了新团队——Black Forest Labs(黑森林实验室)。该实验室总部设在德国

图片

并在8月宣布成立后迅速发布了初代文生图模型Flux1.1。该模型包括三个变体:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell],分别平衡了性能和可访问性。

图片

短短几个月内,黑森林实验室完成了3100万美元的种子轮融资,投资方包括Andreessen Horowitz、Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等著名投资人。此外,黑森林实验室还与马斯克合作,将Flux模型集成到xAI的Grok助手中,进一步扩大了Flux模型的应用场景。

未来,黑森林实验室的团队还计划推出SOTA级文本到视频生成模型,这一领域今年下半年竞争尤为激烈,从Pika 1.5到Meta Movie Gen,新的模型层出不穷。黑森林实验室的加入,势必将为这一快速发展的领域注入新的活力。目前,他们正在以10亿美元的估值筹集1亿美元的资金,相比之前1.5亿美元的估值大幅提升。

从Pika 1.5到Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。

图片

Flux1.1试玩
https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro

参考链接:
[1]https://x.com/fofrAI/status/1841854401717403944
[2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
[3]https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值