【Stable Diffusion初学者指南】如何使用Stable Diffusion

云计算小黄同学

已于 2024-03-08 17:12:49 修改

阅读量1.5k

点赞数 21

分类专栏： AI 文章标签： stable diffusion AIGC ai

于 2024-03-01 16:07:24 首次发布

本文链接：https://blog.csdn.net/ya_shy/article/details/136390994

版权

AI 专栏收录该内容

6 篇文章

订阅专栏

想学习Stable Diffusion人工智能吗？本初学者指南适用于Stable Diffusion或其他 AI 图像生成器零经验的新手。您将获得Stable Diffusion的概述和一些基本的有用技巧。

这是初学者指南系列的第 1 部分。
阅读第 2 部分：提出良好的提示
阅读第 3 部分：修复
阅读第 4 部分：模型指南

什么是Stable Diffusion

Stable Diffusion AI是一种用于生成 AI 图像的潜在扩散模型。这些图像可以是逼真的，就像相机拍摄的图像一样，也可以是艺术风格的，就像由专业艺术家制作的一样。

最好的部分是它是免费的 - 您可以在您的 PC 上运行它。

如何使用Stable Diffusion

您需要给它一个描述图像的提示。例如：

姜饼屋，西洋镜，焦点，白色背景，烤面包，脆麦片

Stable Diffusion会将这个提示变成如下图所示的图像

您可以从同一提示生成任意数量的变体。

Stable Diffusion有什么好处

还有类似的文本到图像生成服务，例如 DALLE 和 MidJourney。为什么要Stable Diffusion？Stable Diffusion 的优点是：

开源：许多爱好者创建了免费的工具和模型。
专为低功耗计算机设计：免费或运行成本低廉。

Stable Diffusion 免费吗

在您自己的Windows或Mac计算机上运行时，Stable Diffusion 可以免费使用。在线服务可能会花费您少量的费用，因为有人需要为您提供运行所需的硬件。

Stable Diffusion能做什么

1. 从文本生成图像

Stable Diffusion最基本的用法是文本到图像（txt2img）。以下是您可以使用Stable Diffusion生成的一些图像示例。

动漫风格

写实风格

景观

幻想

艺术风格

2. 从另一个图像生成一个图像

图像到图像 (img2img) 使用Stable Diffusion 将一幅图像转换为另一幅图像。
图像到图像根据输入图像和提示生成图像

3. 照片编辑

您可以使用修复来重新生成AI或真实图像的一部分。这与 Photoshop 的新生成填充功能相同，但免费。

4. 制作视频

Stable Diffusion制作视频有两种主要方法：(1) 从文本提示和 (2) 从另一个视频。
Deforum是一种根据文本提示制作视频的流行方法。您可能在社交媒体上见过其中之一。看起来像这样。

Deforum演示视频

第二种方法是使用Stable Diffusion对视频进行风格化。
请添加图片描述

这是一个更高级的话题。在深入研究之前最好先掌握文本到图像和图像到图像的知识。

如何使用Stable Diffusion人工智能

AUTOMATIC1111 是一个受欢迎的选择，您可以在云上部署Stable Diffusion：
亚马逊云：【全网最简单】基于Amazon EC2 linux快速部署 Stable Diffusion WebUI
阿里云：【阿里云】使用EAS一键部署Stable Diffusion AIGC绘画

如果您有合适的 PC， PC安装了高性能的显卡，在您的 PC 上运行它也是一个不错的选择。你可以在自己的PC上安装秋叶大神的
整合包：Stable Diffusion整合包v4.6发布

如何打造一个好的提示？

要制作一个好的提示，需要学习很多东西。但基本的是尽可能详细地描述你的主题。确保包含强大的关键字来定义样式。

使用提示生成器是学习分步过程和重要关键字的好方法。对于初学者来说，学习一组强大的关键字及其预期效果至关重要。这就像学习新语言的词汇一样。您还可以在这里找到关键字和注释的简短列表。

生成高质量图像的捷径是重用现有提示。前往提示集合，选择您喜欢的图像，然后窃取提示！缺点是您可能不明白为什么它会生成高质量的图像。阅读注释并更改提示即可查看效果。

或者，使用PlaygroundAI等图像收集网站。选择您喜欢的图像并重新混合提示。但这可能就像大海捞针一样寻找高质量的提示。

将提示视为起点。修改以满足您的需求。

构建良好提示的经验法则

两条规则：（1）详细且具体，（2）使用强大的关键词。

详细且具体

尽管人工智能突飞猛进，但Stable Diffusion仍然无法读懂你的想法。您需要尽可能详细地描述您的图像。

假设您想要生成一张街景中的女性照片。简单的提示

街上的一个女人

给你一个像这样的图像：
在这里插入图片描述

好吧，您可能不希望生成祖母，但这在技术上符合您的提示。你不能责怪Stable Diffusion…
所以，你应该多写一些。

一位年轻的女士，棕色的眼睛，头发亮点，微笑，穿着时尚的商务休闲装，坐在外面，安静的城市街道，边缘照明

在这里插入图片描述
看到巨大的差异。所以，要努力提高你的提示技能！

使用强大的关键字

有些关键字比其他关键字更强大。例子是

名人名字（例如艾玛·沃特森）
艺术家姓名（例如梵高）
艺术媒介（例如插图、绘画、照片）

仔细使用它们可以将图像引导到您想要的方向。
想作弊吗？就像做作业一样，您可以使用ChatGPT来生成提示！

这些参数是什么？我应该更改它们吗？

Stable Diffusion允许您更改一组有限的参数。以下是一些重要的内容：

Image size：输出图像的尺寸。标准尺寸为512×512像素。将其更改为纵向或横向尺寸会对图像产生很大影响。例如，使用肖像尺寸生成全身图像。
Sampling steps：至少使用 20 个步骤。如果您看到模糊的图像，请增加。
CFG scale：典型值为 7。如果您希望图像更多地遵循提示，请增加值。
Seed value：-1 生成随机图像。如果您想要相同的图像，请指定一个值。