就在2024年10月22日,**Stablity公司正式推出他们的第三代stable-diffuison产品,stable-diffuison3.5,**相比于前两代的stable-diffuison产品有了巨大提升,具体包括:
-
stable-diffuison3.5引入了多模态Transformer(MMDiT)新构架,这种构架结合了扩散型和Transformer技术,提升了文本理解和图像生成的质量,使得生成的图像在细节和布局上更为精确
-
第三代模型参数大幅度增加,从800万像素到80亿不等,这使得图像分辨率上限从第二代的768x768提升到2048x2048,显著改善了图像的质量和细节表现;
-
新版本在生成图像时速度更快,且在保证高质量输出的同时更加节省计算资源。这一改进对需要快速生成大量高质量图像的用户特别有用;
-
在文本生成和理解方面,Stable Diffusion 3 具备了更强的能力,可以准确地渲染图像中的文字内容,减少文字生成中的对称性问题和错误。这使得新版本在提示词的准确性和一致性方面有了显著提升;
-
第三代提供了更灵活的图像生成参数,用户可以调节风格、构图和色彩等特性。此外,支持多模态输入,允许结合文本、草图或参考图像等多种信息来生成图像;
下面这几组图片是通过stable-diffusion3.5生成的图片:
图1:名侦探柯蓝
图二:皮卡丘
图三:汤姆猫
图四:一个中国女孩
当然,如果你想无安装在线体验这款最新的AI绘图工具,那么你可以打开LibLibAI官网,在第一页你就可以看到最近新出的stable-diffusion3.5,按照下述方式进行操作,你就可以马上使用这款新的AI工具:
这个网页版应用程序只能免费生成有限次数的图像,超过一定数量后,就需要购买他们的套餐。不过,如果你的电脑性能足够强,比如配备了一张 NVIDIA 显卡,且显存达到 16GB 以上,那么恭喜你,可以在本地部署这个强大的 AI 绘图工具。
首先你需要获取一个最新版的comfyui一键整合包,你可以考虑到github上下载:
https://github.com/comfyanonymous/ComfyUI/releases/download/v0.2.4/ComfyUI_windows_portable_nvidia.7
不知道如何下载?可以查看下面的步骤:
在将comfyui准备就需后,下一步:获取运行stable-diffusion3.5的大模型以及对应的comfyui工作流,关于大模型的获取,可以直接考虑到stabilityAI公司提供的hugingfgace网站上:
https://huggingface.co/stabilityai/stable-diffusion-3.5-large
在打开上述网站后,首先你需要先注册并登录你的huaggingface账号,然后才能下载到模型页面下载对应的文件
如果你已经成功登录了 Huggingface 账号,并在模型页面进行下载,但感觉下载速度不够理想,你可以参考下面这篇文章的方法。首先,将所需的大模型下载到 Google 云盘,然后使用 IDM 从 Google 云盘中将模型下载到本地。
这里分享给大家的文件主要包括两个stable-diffuison3.5类型的模型,一个是Stable Diffusion 3.5 Large、另外一个是Stable Diffusion 3.5 Large Turbo ,这两个模型的大小均为16GB,且都需要单独的Clip模型来驱动,它没有内置Clip模型,使用过程中均需要16Gb显存以上的电脑。但它们生图的速度有着明显差别,首先是Stable Diffusion 3.5 Large Turbo的生图速度会更快一些,但生图的质量稍逊于Stable Diffusion 3.5 Large。
另一个关键区别就是适用场景不同,Stable Diffusion 3.5 Large 适合需要极高图像质量的专业应用,如精确的视觉效果或复杂提示词的处理,尤其是在更高分辨率(如 1 兆像素)的情况下表现优秀。Large Turbo更适合对速度要求较高的场景,在保证图像质量的前提下,加快生成过程,是时间敏感任务或资源有限的用户的理想选择。
除了上述两个模型外,还有三个clip模型:clip_g.safetensors**、clip_l.safetensors、**t5xxl_fp8_e4m3fn.safetensors ,以及**两个comfyui工作流,**详情请见下图所示的演示:
在完成上述所有操作后,**接下来,就是将下载的模型放置到comfyui的models文件目录下,**首先就是将Stable Diffusion 3.5 Large Turbo 、Stable Diffusion 3.5 Large这两款大模型放置到如下目录内:
..\ComfyUI\models\checkpoints
而然后就是Clip这三个模型这放置到models目录下的clip文件夹内:
..\ComfyUI\models\clip
具体请看下图演示:
接下来,启动 ComfyUI 并加载工作流。然后,选择你刚刚配置到目标位置的大模型。在提示词输入区域中输入你想要生成的图像描述,最后点击生成即可。具体演示请参看下图:
下面我们使用comfyui进行生图创作:
1、使用sd3.5创建**《熊出没》中的"熊大"**
所用提示词:``A large, friendly cartoon bear with a muscular build and a wide,` `joyful smile, resembling Xiong Da from "Boonie Bears."` `He is standing in a colorful forest clearing,``surrounded by tall pine trees and bright flowers, with a clear blue sky above.``The bear is wearing his signature green shorts, and his expression is cheerful and welcoming.` `The sunlight creates a soft glow over the scene, highlighting the vibrant and fun nature of the character. 3D cartoon style with exaggerated shapes, smooth textures, and vivid colors to capture the playful spirit.
小红帽:
提示词:``A young girl in a bright red hooded cape,``resembling Little Red Riding Hood, standing in the middle of a mystical forest.` `She is holding a small basket filled with flowers and freshly baked bread,` `with a curious and innocent expression on her face.``The trees around her are tall and covered with thick green moss,` `and soft rays of sunlight filter through the dense canopy,` `creating a magical and slightly mysterious atmosphere.``3D cartoon style with smooth textures, exaggerated facial features,` `and vibrant colors to highlight the fairytale setting
白雪公主:
提示词:``A beautiful young girl with fair skin,``black hair, and rosy cheeks, resembling Snow White,` `standing in a lush forest clearing.` `She is wearing a classic blue and yellow dress with a red bow in her hair,``holding a delicate red apple in one hand.``Sunlight filters through the tall trees, creating a magical,``dappled light effect over the scene. The atmosphere is warm and enchanting,` `capturing the innocence and charm of a fairytale setting. 3D cartoon style with smooth textures, vivid colors, and a slightly dreamy atmosphere to enhance the fairytale magic.``
皮卡丘:
`A cheerful 3D cartoon yellow creature with large pointy ears,` `red cheeks, and a lightning-shaped tail, resembling Pikachu,` `standing in a vibrant forest.` `He has a playful smile and is surrounded by colorful flowers and bright green trees.``The sunlight creates a warm, golden glow that highlights the soft texture of his fur.` `His eyes sparkle with excitement, and tiny electric sparks flicker from his cheeks,` `adding a sense of liveliness to the scene. The atmosphere is bright, joyful,` `and full of energy, capturing a playful and adventurous spirit. 3D cartoon style with smooth textures,` `exaggerated features, and vibrant colors to bring the character to life.`
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
【SD3.5模型包也在下面哟】
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。