Stable Diffusion零基础入门教程,轻松掌握AI创作!

前言

Stable Diffusion,一款开源的先进图像生成模型,通过其独特的算法,能够根据文本描述创造出精美的图像。它不仅支持图像生成,还包括图像修复和风格转换等多项功能,为视觉艺术和设计领域带来了革命性的变革

在本期专栏中,我们将提供一个简明的Stable Diffusion入门教程,帮助初学者快速掌握其界面操作和基础功能,轻松开启这一应用的AI创作之旅

StableDiffusion资源放在了文末,需要的文末自提

在这里插入图片描述
首先,访问OneThingAI官网,进入【AI实验室】,在【应用中心】中点击【创建应用】以启动Stable Diffusion应用

在这里插入图片描述
等待应用状态变为“运行中”,图标亮起后,点击【SDWebUI】即可进入应用

在这里插入图片描述

应用界面

在Stable Diffusion平台的WebUI界面,位于界面左上角的是模型选择区域,该区域提供了多种风格迥异的模型选项,包括但不限于写实风格、漫画风格等,以满足不同用户的创作需求

在这里插入图片描述
紧邻模型选择区域下方是工具栏,这里集合了一系列基础与高级的绘画工具
在这里插入图片描述
例如,模型合并功能及3D Openpose编辑器等,这些专业术语可能初看之下令人感到陌生

在这里插入图片描述
在这里插入图片描述

不过,请放心,接下来我将详细介绍两个最为基础且实用的绘画功能:

文生图(Text-to-Image)和图生图(Image-to-Image),以便大家快速上手
在这里插入图片描述

提示词输入区位于工具栏下方,分为提示词(Prompt)和反向词(Negative Prompt)两部分。提示词用于指定希望AI生成的内容,而反向词则用于排除不想要的元素,两者结合使用可精确控制AI的图像创作

在这里插入图片描述
提示词下方则是一些图像生成参数的调整,其中包含了

  • 图像分辨率:图像的宽高比

  • 采样迭代步数:步数参数越高生成的图像就显得更加精致,反之则会更加简洁

  • 提示词相关性(CFG):CFG决定模型遵循文本提示的程度;低值可能导致忽略提示,而高值可增强图像色彩饱和度

  • 图像生成批次:图像生成张数
    在这里插入图片描述
    而现在,我将先给大家进行“文生图”功能的演示,让大家通过“文生图”体会到AI图像生成的乐趣。

基本应用功能

“文生图”(Text-to-Image)

在“文生图”功能中,用户通过输入文本提示词来创作图像。应用内嵌的提示词库简化了新手构思提示词的过程

在这里插入图片描述
我们选取了两个模型进行演示:Leosam_FilmGirl_Ultra.safetensors产生写实电影风格的图像,而AWPainting_1.4.safetensors则偏向动漫风格

在这里插入图片描述
在这里插入图片描述
以Leosam模型为例,我们尝试生成一幅“女孩在海边沙滩奔跑”的场景。

通过选择整合的提示词,如【人物-1女孩】、【表情动作-基础动作-奔跑】、【环境-氛围-海边日落】和【环境-水-海滩】,以及增强画质的提示词【画面-画质-极高分辨率】和【画面-艺术风格-原画】

系统将自动匹配相应的英文提示词,以辅助生成理想中的图像

在这里插入图片描述
点击“生成”按钮,让我们观赏所创作的图像成果

在这里插入图片描述
在这里插入图片描述

生成的图像中出现了身体比例失衡和穿模现象,这可能是因为AI在处理复杂逻辑结构,如人体形态和器官时,表现不佳。然而,存在方法可以减少此类问题的发生。

利用“反向词”功能,我们可以有效减少图像生成中的错误。通过选择【反向提示词-画面】和【反向提示词-人】里的提示词,我们可以进一步优化生成图像的质量。

在这里插入图片描述

看到生成参数,勾选上【高分辨率修复】,将【采样迭代步数】设置成50并将【提示词相关性】设置成8
在这里插入图片描述
并启用的细节修复,这样也可以减少生成错误图像的发生

在这里插入图片描述
再次“生成”,生成出来的图像会更加和谐且清晰
在这里插入图片描述
“图生图”(Image-to-Image)

"图生图"功能,即AI基于现有图像创作新图像。启用此功能后,用户将发现其参数界面与“文生图”有所不同。

在生成参数下方,"图生图"提供了手绘修正和局部重绘等高级功能,这些将在后续的进阶教程视频中详细介绍

在这里插入图片描述
“图生图”的生成参数中还有“重绘幅度”选项,重绘幅度越高,画面自由度就越高。重绘幅度越低,生成出来的图像就越接近上传的图片

在这里插入图片描述
我们上传一张小狗图片
在这里插入图片描述
并在提示词文本框中,输入与图像画面元素相符的提示词
提示词:1dog, running, on grass
在这里插入图片描述

这里我给大家提供一个万能反向词,这样大家就不用每次都需要在提示整合中频繁选择提示词了。

反向词:NSFW, lowres, bad anatomy, bad hands, ((text)), (watermark), error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, ((username)), blurry, (extra limbs)

将模型选择为AWPainting,点击生成

在这里插入图片描述

图像生成的结果与上传图片紧密相关,显示出“图生图”功能的强大。介绍完“文生图”和“图生图”后,可以尝试自己操作以巩固本次教程的内容。

图像保存

如何将图像保存,完成图像生成后。在图像生成区,点击图像,右键将图像另存为本地文件夹,这样我们的图像就保存在了本地电脑端中
在这里插入图片描述
若需检索刚生成的图像,请使用工具栏中的【图库浏览器】,所有图像均存储于此,可自由下载

在这里插入图片描述

StableDiffusion安装包

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好,需要的点击下方插件,即可前往免费领取!

在这里插入图片描述

  • 13
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值