离开SD的大佬们另组战队,开源新品牌冲击MJ王座

在这里插入图片描述

FLUX.1强势登场,秒杀Midjourney?

Midjourney 6.1 才发表几天,FLUX.1立刻就来踢馆了

离职四个月,Stability AI 核心成员 Robin Rombach 前几日官宣成立了 Black Forest Labs,公司推出的第一个产品 FLUX.1,一出世便宣称效果直接秒杀 Midjourney 和 DALL-E。

咱们 IMYAI 主站目前已经上了快速版。整体感受就是…

快!

基本上每一张图片的生成都用不到 10 秒,这一点图欧君觉得远超目前的 Midjourney。

在提示词遵循、文本方面也超越了 Midjourney。

虽然 FLUX.1 的视觉质量不错,但还是比不过它的老大哥 Midjourney,甚至还有很长一段路要走。

FLUX.1 更倾向于稳定、准确,毕竟前身是 Stable Diffusion(stable 的意思就是稳定)。

动漫风景

生成一张动漫风格的樱花图片:

  • 提示词: cherry blossoms all around, anime style
  • 效果对比:
    • FLUX.1:
      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    • Midjourney:
      在这里插入图片描述

提示词只是单纯的樱花风景,但 Midjourney 进行了默认优化,加了人的元素进来。

这对不擅长 AI 绘画的人来说其实是不友好的,因为无法像 Midjourney 一样从四个图片里面选择一个,或按照其中一个风格进行再次绘制图片。

真实风景

这种超现实风格的图片让图欧君眼前一亮,乍一看还真不好分辨,甚至在某种程度上 FLUX.1 比 Midjourney 更真实。

  • 提示词: 弗莱堡一条美丽街道的照片,一辆有轨电车经过,人们有的散步有的骑自行车
  • 效果对比:
    • FLUX.1:
      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    • Midjourney:
      在这里插入图片描述

真实人物

  • 提示词: A real woman with brown hair is sitting in the car, raising her hand with "i am not real" written on her palm

  • FLUX.1生成效果:

    在这里插入图片描述

这张人像很真实,只是觉得文本“i am not real”看着有点突出。

可能也是因为人像的脸部并不是特别清晰,增加了朦胧,进而减少 AI 感。

一旦把人脸调清晰点,FLUX.1 就很明显不如 Midjourney 了。

  • 提示词: A real woman with brown hair is sitting in the car with smiling

  • 效果对比:

    • FLUX.1:
      在这里插入图片描述

    • Midjourney:
      在这里插入图片描述

  • 提示词: A rugged man in his 30s, surreal style

  • 效果对比:

    • FLUX.1:
      在这里插入图片描述

    • Midjourney:
      在这里插入图片描述

文字生成

FLUX.1 的文字处理确实比较好,就之前“i am not real” Midjourney 生成的图而言,就有一种图生成了,再把文字 P 上去的感觉,有严重的割裂感,并且文本也不对。

  • Midjourney:
    在这里插入图片描述

不过虽然 FLUX.1 的文本处理得较好,最好全用英文,否则也会出现以下情况…

  • 提示词: 一个真实的棕色头发的女人坐在车里,举起手,手掌上写着“你是谁”
  • FLUX.1生成效果:
    在这里插入图片描述
    在这里插入图片描述

之前图欧君也曾画过紫禁城,这个地方两者虽然提示词一样,但风格不一致,就不比较视觉效果了。

  • 提示词: /imagine prompt: A page from a modern magazine about the Forbidden City, filled with detailed text, lines pointing to parts of the building, showcasing intricate architecture, and several graphs. The layout includes high-resolution images of the Forbidden City, with annotations explaining architectural elements. Created Using: Adobe InDesign, architectural photography, vector illustrations, infographic design, modern magazine style, high detail, raw look --ar 3:4 --v 6.0
  • 效果对比:
    • FLUX.1:
      在这里插入图片描述

    • Midjourney:
      在这里插入图片描述

单从文本来看,FLUX.1 在这一点上基本上是超过 Midjourney 的,至少都能看出来是一个个字母。MJ 看起来虽然规规整整的,但其实放大看啥也不是,里面似乎都是一个个小方块…

动物形象

  • 提示词: 画一条龙
  • FLUX.1初始生成效果:
    在这里插入图片描述

FLUX.1 画条龙有点抽象,真的不愧是“画”条龙,把如何画画、用画笔画龙的这个动作过程都给画出来了。乍一看好像也没毛病(?)

与擅长语言识别的 GPT-DALL.E 不同,开源模型的通病就是非常直白地把你投喂的每个字都尽力表达在纸上。所以我们技术对 FLUX.1 的提示词提交部分做了一定的优化,现在使用起来终于不再是人工智障了。

不过在颜值审美方面一言难尽……有一种简单粗暴的美(?)

  • 效果对比:
    • FLUX.1 提示词优化后:
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

其他模型还是稳定发挥吧,DALL-E 这 AI 感还是很强…不过 Kling 和混元倒是眼前一亮,这两个画得很好看,跟 niji 不相上下。

  • 提示词: 画一个皮卡丘举着牌子,牌子里写着“IMYAI”
  • 效果对比:
    • DALL-E:
      在这里插入图片描述

    • FLUX.1 提示词优化后:
      在这里插入图片描述

可惜 FLUX.1 没有 DALL-E 那种创意感,基本上是直接依葫芦画瓢,照着 IP 原本的模样进行绘图,版权问题仍需注意。

总结

FLUX.1 虽然初始玩法比较单一,不能像 Midjourney 那样自定义比例、风格、放大重绘等,也不能像 DALL-E 那样连续对话,但是作为一款开源模型,相比上一代开源模型霸主 Stable Diffusion 来说,已经是非常出色了。

在没有控制器加持的效果下,出图效果就已经比肩 Midjourney v6,不输 DALL-E。倘若民间各种 AI 大神为其开发各种插件(比如:ControlNet),岂不是起飞?

网上有句话说得好,“江山代有模型出,各领风骚数十天”。今天 AI 界最耀眼的新星当属 FLUX.1,那下一个黑马又会是谁呢?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

图欧科技团队

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值