最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像,网友:我分不清啊...

梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI

最新AI文生图模型Flux1.1,一夜刷屏。

只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。

95b7aaf574721d5bed95012f49c10011.png

评论区网友的反应be like:我分不清,真的分不清啊。

ba2615d287ddcd61220ee2a431cdbdc0.png

这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。

比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG”+随机编号+“.CR2”,再加指定的内容,就能获得一张写实图像了。

f104606ec6d6a2ce8a7634492e2be41b.png

后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。

e14dbeb407f18b343a7fcfdc5369a71f.png

以至于有人都开始怀疑,不会是模型随机吐出来一张训练数据里的真照片吧?

9d9c638870c4c62a027d3b4d0c2f071f.png

不过放大看一些特定细节,还是很容易看出确实是AI生成的,比如车牌号上的文字都是乱码。

95d4e85c488f78c4eebf6ee599b5a34d.png

那么是否Flux1.1模型本身能力就很强大,这个技巧在其中起到了多大作用呢?

一位资深修图师傅晒出了对比,左边加了IMG_1018.CR2,对比右边不加的,他认为差别巨大。

f5207047227ed70c12183ec7c0d7fcd7.png
df1765aaaf7b9c1d3ed38c7bebde6c3d.png

我们的实测结果也能看出,加上这个技巧能显著提升画面真实性。

现在想免费试玩这个Flux1.1模型,可以来到together.ai平台,注册即送5美元的积分。

ef5a6d70fcb742040bd92424ec163f1c.png

随便生成一张在长城的游客自拍照,乍一看像那么回事,但仔细观察人物皮肤质感、背景山和植物都有还是有一股AI味。

4dfedf5e2d76313bf1eb4badc3ce719c.jpeg

换成“IMG_0314.cr2: selfie on The Great Wall”,是不是立马就不一样了?

7394b1b246f5f97e69762c2edd14a3f2.jpeg

代号蓝莓,最新SOTA文生图模型

随着FLUX1.1的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。

ecf9c67571dc5f8a274a9c5a10f41dd7.png

官方不藏了,直接放出数据,在Artificial Analysis image arena上,FLUX1.1 [pro]以“blueberry”为代号,超越所有其它模型,获得最高的整体Elo评分。

a81e90dc6552c8e750d411f8fef69ee6.png

相比之下,FLUX1.1 [pro]价格也更低,速度更快,各项指标超越Midjourney、SD3、Ideogram等。

c247572d02847d38b06a1e2cd94bbee3.png
6fec68548a41d4d7737d55794a5c6fb1.png

生成速度上,FLUX1.1 [pro]在保持图像质量、指令响应和多样性提升的同时,速度是前代FLUX.1 [pro]的6倍。

顺便提一下,现在FLUX.1 [pro]也进行了更新,速度是之前的2倍,FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。

此外,官方表示即将推出快速高分辨率生成,FLUX1.1 [pro]可原生支持的那种,在不牺牲任何指令响应情况下,能生成2k图像。

FLUX1.1 [pro]将通过Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。

同时官方还推出了BFL API,可供其他开发者集成到自己的应用程序中,API定价是:

  • FLUX.1 [dev]:每张图2.5美分(约RMB 0.18元)

  • FLUX.1 [pro]:每张图5美分(约RMB 0.35元)

  • FLUX1.1 [pro]:每张图4美分(约RMB 0.28元)

Stable Diffusion原班人马打造

FLUX1.1 [pro]的背后是Stable Diffusion原团队,成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。

7fa0c6ec21382a0701c7df356c425de6.pngRobin Rombach

其实Stable Diffusion最初是一个学术研究项目。

由Björn Ommer教授领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习研究小组成员,以及Runway的研究人员Patrick Esser完成。

b26c85346a7cae3404b2498fe0093af9.png

研究论文发表七个月后,Stability AI开始介入,提供计算资源,以进一步开发文本到图像生成模型。2022年,上述几位论文作者加入Stability AI。

团队一同创建了Stable Diffusion XL、Stable Video Diffusion等。

ICML 2024最佳论文之一、Stable Diffusion 3技术论文的Rectified Flow Transformers,还有SDXL-Turbo使用的对抗扩散蒸馏方法(Adversarial Diffusion Distillation),也是这帮子人在研究。

今年三月份这些核心研究团队成员被曝集体辞职。

而后,他们组成了新团队名为Black Forest Labs(黑森林实验室),总部位于德国。

a53f86412b7cb850cf31dea7f0154bf3.png

今年8月初刚刚宣布成立,并发布了其初代文生图模型FLUX.1,FLUX.1有三个变体:FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell],平衡了性能和可访问性。

fb4f54fd3c478510747fa4c214f4c544.png

目前黑森林实验室已完成种子轮融资,共融资3100万美元,Andreessen Horowitz领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。

据说他们还已经收到General Catalyst、MätchVC的后续投资。

黑森林实验室和马斯克还有合作,将其图像生成模型引入xAI的Grok助手中。

接下来,团队透露将推出SOTA级文本到视频生成模型

据说他们正在以10亿美元的估值筹集1亿美元资金,比之前1.5亿美元的估值大幅上涨。

从Pika 1.5到Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。

eedf5a3d2eac78532b895c7d86913d7f.gif

Flux1.1试玩
https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro

参考链接:
[1]https://x.com/fofrAI/status/1841854401717403944
[2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
[3]https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道,评选从企业人物产品三大维度设立了5类奖项。

欢迎扫码报名评选!评选结果将于12月MEET2025智能未来大会公布,期待与数百万从业者共同见证荣誉时刻。

14409b66a83b70864959b3e47562c14e.png

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值