万众期待的StableDiffusion3实测,MidJourney不再香?

作者:金天
链接:https://zhuanlan.zhihu.com/p/703589831
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

SD3 Medium目前已经可以免费获取了,大家可以前往HF下载。作为文生图的带头大哥,开源届的杠把子Stable Diffusion在SD3上继续开源,再一次让我们这些伸手党们,感受到了深深的幸福。你不需要羡慕那些高端玩家秀出完美的AI图,现在,仅用16GB的显存,在消费级显卡上,你也可以开始艺术创作之旅。

本文所有的艺术图片均基于A100生成。经费在燃烧,走过路过的朋友还请点个赞。

为了测试StableDiffusion3的能力,决定继续从几个我比较关心的维度进行:

  • • 文字生成能力,这也是之前的版本不具备的;
  • • 图片Conditional的编辑能力,这是SD3吹嘘的;
  • • 未知事物想象能力以及对文本的遵循能力。

在测试过程中,我发现SD3对于指令的遵循虽然还比较到位,但是如果句子不够通顺的时候极大的会影响生图质量和效果,反而差点意思。于是我们不得不请出一个帮手:Qwen2来辅助生成Prompt:

这个客户端是我见过最美观、最精简的大模型客户端,支持Windows,macOS,Android,iOS,需要的可以留言。

后面我无法准确用英文描述的指令,都会用他来帮助我修饰和生成。

文字能力

Prompt:

A colossal, ferocious tiger warrior, brandishing a flag inscribed with "Open Source SD3", rendered in hyperrealistic detail. The fur has lifelike texture, the muscles are taut with strength, and the warrior's expression is fierce and determined. The flag flutters dynamically in the wind, capturing the essence of movement. The scene is bathed in realistic lighting, enhancing the sense of depth and dimension. This depiction is a testament to the artist's mastery of realism, with attention to every minute detail, from the whiskers to the claws, ensuring a sense of authenticity and presence.

“Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

SD3对几何构图、颜色都具有非常好的遵循,但就是.... 拼运气,这张图生成了3次,前两次都没有狗..... 整体来说非常惊艳

对文字很遵循啊,以至于我在想是不是多模态也可以迎来AI造数据的时代....

Welcome cake for SD3 event, "Welcome to SD3" inscription, realistic icing texture, soft pastel colors, detailed cake layers, sharp focus on the letters, warm studio lighting, digital painting, hyperrealistic, mouthwatering details, by celebrated food artist, artstation, highly detailed, vivid colors, professional quality.

可以用Impressive来形容了!

让我们改成巧克力水果蛋糕来试一下。。

虽然有些拼写错误,但是效果依旧相当的炸裂啊!

可以可以,道理我都懂,但是为什么苹果也能点?以后是不是可以直接用SD3生图发朋友圈装x了?

再来测试一些长图,看看以后能不能用来做Banner?

关注我,这个测评下一期咱们继续。。

可以说文字能力基本上很强了,接下来测试一下人物。

a. 美国队长和灭霸在终局之战中大战,美国队长和灭霸相拥而泣

Captain America and Thanos in the climactic battle of the Endgame, a poignant moment of embrace and tears, hyperrealistic depiction, intense emotional expression, detailed costumes and armor, dramatic lighting to highlight the gravity of the scene, digital painting, fantasy, high detail, vivid colors, by a renowned comic artist, artstation, sharp focus, physically-based rendering, extreme detail description, professional quality, emotional intensity.

哎,等等!感觉哪里不对?

埃,这才对了嘛。

b. 死侍和女死侍在沙滩上晒太阳

Deadpool and Wolverine relaxing on the beach, enjoying the sun, hyperrealistic skin textures, casual beachwear with Deadpool's iconic red suit and Wolverine's rugged look, playful interaction between the two, sun-kissed highlights, realistic sand and ocean backdrop, digital painting, comic book style, high detail, vivid colors, by a celebrated comic artist, artstation, sharp focus, warm sunlight effects, casual and fun atmosphere, professional quality, dynamic composition.

这细节..... 堪称一绝!女死侍的头发应该是包在里面的还是露在外面的?

c. 一键三连暗示

这个细节微操度,基本上可以做到指哪儿打哪儿。

d. Pixar art

a colorful picture of a giant banana teaching math to strawberries on blackboard, classroom, pixar art

d. Time Travel

中世纪逛街的场景:

"Evoke the realism of an 18th-century European street scene with meticulously detailed figures, authentic period attire, and a backdrop of historical architecture. The bustling atmosphere should be palpable, with each individual's posture, expression, and interaction captured in a lifelike manner that reflects the social dynamics of the time. Employ a hyperrealistic approach to bring the scene to life, ensuring the textures, lighting, and colors are true to the period, creating an immersive experience for the viewer."

十八世纪的欧洲小镇:

e. Portait.

"Capture a sultry girl with striking green hair, fox ears, and captivating large eyes, leaning against a graffiti-covered wall with vibrant purple hues. She dons a seductive purple strap top and ultra-short shorts, her figure accentuated by a softly blurred background, all rendered in a hyper-realistic style."

这操控度,几乎就是无敌一般的存在,你想要实现的每一个细节,都能完美呈现。

下一部分我们将继续探索一下SD3的图片编辑能力。

最后想说 AIGC(AI Generated Content)技术,即人工智能生成内容的技术,具有非常广阔的发展前景。随着技术的不断进步,AIGC的应用范围和影响力都将显著扩大。以下是一些关于AIGC技术发展前景的预测和展望:

1、AIGC技术将使得内容创造过程更加自动化,包括文章、报告、音乐、艺术作品等。这将极大地提高内容生产的效率,降低成本。2、在游戏、电影和虚拟现实等领域,AIGC技术将能够创造更加丰富和沉浸式的体验,推动娱乐产业的创新。3、AIGC技术可以帮助设计师和创意工作者快速生成和迭代设计理念,提高创意过程的效率。

未来,AIGC技术将持续提升,同时也将与人工智能技术深度融合,在更多领域得到广泛应用。感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程。

对于从来没有接触过AI绘画的同学,我已经帮你们准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

img

AIGC学习必备工具和学习步骤

工具都帮大家整理好了,安装就可直接上手

image-20240529102035410

现在AI绘画还是发展初期,大家都在摸索前进。

但新事物就意味着新机会,我们普通人要做的就是抢先进场,先学会技能,这样当真正的机会来了,你才能抓得住。

如果你对AI绘画感兴趣,我可以分享我在学习过程中收集的各种教程和资料。

学完后,可以毫无问题地应对市场上绝大部分的需求。

这份AI绘画资料包整理了Stable Diffusion入门学习思维导图Stable Diffusion安装包120000+提示词库,800+骨骼姿势图,Stable Diffusion学习书籍手册AI绘画视频教程AIGC实战等等。

完整版资料我已经打包好,点击下方卡片即可免费领取!

【Stable Diffusion安装包(含常用插件、模型)】

img

【AI绘画12000+提示词库】

img

【AI绘画800+骨骼姿势图】

img

【AI绘画视频合集】

img

还有一些已经总结好的学习笔记,可以学到不一样的思路。

在这里插入图片描述

实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

  • 10
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值