Stable Diffusion 3来袭,又一场视觉盛宴的体验

就在Stable Cascade发布10天后,StabilityAI又发布了 Stable Diffusion 3 的早期预览版,这次SD3文生图模型的多主题提示(multi-subject prompts)、图像质量(image quality)和拼写能力(spelling abilities)都有了非常大的提升。SD3采用了和Sora同样的架构“diffusion transformer”,还引入了“flowmatching”,虽然官方并未发出详细的技术概要,但我们可以参考“Flow Matching for Generative Modeling”和“Scalable Diffusion Models with Transformers”的论文来了解下“diffusion transformer”和“flowmatching”到底是啥?形象的解释在文章结尾处。

下面我们来看看官方放出的示例图

图片

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy

提示词:史诗般的动漫艺术作品,一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语,上面写着“Stable Diffusion 3”,由五颜六色的能量制成

图片

Prompt: a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion”

提示:一幅宇航员骑着一头穿着芭蕾舞短裙的猪,手里拿着一把粉红色的雨伞,猪旁边的地上是一只戴着礼帽的知更鸟,角落里是“stable diffusion”的字样

图片

Prompt: studio photograph closeup of a chameleon over a black background

提示:黑色背景上变色龙的工作室照片特写

图片

Prompt: cinematic photo of a red apple on a table in a classroom, on the blackboard are the words “go big or go home” written in chalk

提示:教室桌子上红苹果的电影照片,黑板上用粉笔写着“go big or go home“的字样

以上是这些是官方放出的示例图,可以看出SD3理解提示词的能力将不再以“单词”为优,对于自然语言的理解也非常优秀。图像的质量相对于SDXL已经提升了非常多,甚至都不需要强调画面质量的提示词,最重要的是单词拼写能力已经能做到”我输入什么样的词,图像就生成什么样的词“。再者就是图像细节的处理也非常棒,不再是扭扭曲曲,不可名状之物了。

以下是网友放出的一些SD3成图:

图片

Prompt: Three transparent glass bottles on a wooden table. The one on the left has red liquid and the number 1. The one in the middle has blue liquid and the number 2. The one on the right has green liquid and the number 3.

提示:木桌上放着三个透明玻璃瓶。左边的那个是红色液体,数字是 1。中间的那个是蓝色液体,数字是 2。右边的那个是绿色液体,数字是 3。

图片

Prompt: Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

提示“蓝色立方体顶部的红色球体的照片。在他们身后是一个绿色的三角形,右边是一只狗,左边是一只猫”


接下来,我用同样的Prompt在DALLE3上做一下测试对比

(上图SD3,下图DALLE3)

图片

图片

Prompt: a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion”

提示:一幅宇航员骑着一头穿着芭蕾舞短裙的猪,手里拿着一把粉红色的雨伞,猪旁边的地上是一只戴着礼帽的知更鸟,角落里是“DALLE3”的字样

图片

图片

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “DALLE3” made out of colorful energy

提示词:史诗般的动漫艺术作品,一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语,上面写着“DALLE3”,由五颜六色的能量制成*

图片

图片

Prompt: studio photograph closeup of a chameleon over a black background

提示:黑色背景上变色龙的工作室照片特写

图片

图片

Prompt: cinematic photo of a red apple on a table in a classroom, on the blackboard are the words “go big or go home” written in chalk

提示:教室桌子上红苹果的电影照片,黑板上用粉笔写着“go big or go home“的字样

图片

图片

*Prompt: Three transparent glass bottles on a wooden table. The one on the left has red liquid and the number 1. The one in the middle has blue liquid and the number 2. The one on the right has green liquid and the number 3.

提示:木桌上放着三个透明玻璃瓶。左边的那个是红色液体,数字是 1。中间的那个是蓝色液体,数字是 2。右边的那个是绿色液体,数字是 3。

图片

图片

Prompt: Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

提示“蓝色立方体顶部的红色球体的照片。在他们身后是一个绿色的三角形,右边是一只狗,左边是一只猫”

对于DALLE3生成的图小伙伴们怎么看,可以在留言区讨论噢,反正有几张图我是绷不住了。

目前,SD3还处于早期预览版,想要体验SD3的文生图能力,可以提交愿望单,申请通过后会以邮件的方式发到您申请的邮箱,在Discord服务器使用。

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

需要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

1.stable diffusion安装包 (全套教程文末领取哈)

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值