文生图——stable diffusion生成有趣的动漫图像

love you joyfully

已于 2024-04-10 18:16:55 修改

阅读量2.4k

点赞数 37

分类专栏：创意AI小分享文章标签： stable diffusion 人工智能

于 2024-04-06 16:03:38 首次发布

本文链接：https://blog.csdn.net/weixin_60223645/article/details/137113922

版权

创意AI小分享专栏收录该内容

7 篇文章

订阅专栏

Stable Diffusion是一个文本转图像的模型，由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外，它还可以导入图像并配合文本对其进行处理。从技术角度来看，Stable Diffusion可以理解为从一张完全的高斯噪音图像开始，根据用户输入的要求，逐步剔除噪音，直到产生出用户所要图片的过程。

接下来，让我们使用stable diffusion模型来生成有趣的动漫图像吧！

step1：stable diffusion模型获取

方法1：stable diffusion官网地址为Stable Diffusion 3 — Stability AI，可以参考网站Home · AUTOMATIC1111/stable-diffusion-webui Wiki (github.com)安装使用模型。本地下载，这个方法需要读者具有较好的电脑设备，最好有英伟达的GPU，详细方法可参考Install and Run on NVidia GPUs。下方我们介绍一下文中方法1的安装步骤：

在网站Release v1.0.0-pre · AUTOMATIC1111/stable-diffusion-webui (github.com)下载
sd.webui.zip，下载解压后把解压后的文件夹放在一个合适的位置上；
首先，运行文件夹中的update.bat文件，再运行文件夹中的run.bat文件，如果如果不出意外的话，你将会在浏览器看到以下内容：

方法2：如果本地无法进行安装，则可以尝试使用stable diffusion的国内镜像服务，比如下方这款AUTOMATIC1111/stable-diffusion-webui/NovelAI-Consolidation-Package-3.1: [自带UI启动器]最强云端AI绘画整合版-SDWebUi1.8+SDXL+最新Controlnet+DB训练插件+Roop+AnimateDiffV3+各种插件以及各种依赖模型下载(镜像长期维护更新) - CG (codewithgpu.com)

也可以通过下方一些网站体验文生图或图生图的功能，不过界面可能会与stable diffusion不同，本文后序讲解将基于stable diffusion原始界面：

step2：动漫图像的获取步骤

此处，我们介绍在本地安装stable diffusion模型后的步骤工作。

首先，利用stable diffusion自带的模型基本上获得不了好看的动漫图像，这时，我们不妨在CamelliaMIx_2.5D - V3 | Stable Diffusion Checkpoint | Civitai中下载CamelliaMIx_2.5D模型，将模型进行导入。

将下载好的模型文件放入\sd.webui\webui\models\Stable-diffusion文件夹中，你会发现该文件夹中有原始的stable diffusion模型，不过之后我们将使用新的模型生成图像。可以看到，在相同提示词下，新的模型将有更符合大众审美的输出：

step3：如何生成更好的提示词

要使用Stable Diffusion模型生成有趣的动漫图像并获得更好的提示词，你可以遵循以下方法和步骤：

明确目标：首先，确定你想要生成的动漫图像的主题、风格和氛围。是可爱的、搞笑的、还是冒险的？明确目标有助于你更精准地选择提示词。
收集灵感：浏览各种动漫作品、插画、艺术作品或在线资源，以收集灵感和参考。注意动漫中的颜色搭配、角色设计、场景构图等元素。
分析并提取关键词：从你收集的灵感中，分析并提取出与主题、风格、角色、场景等相关的关键词。这些关键词将成为你的提示词的基础。
构建提示词：使用提取出的关键词来构建你的提示词。尝试使用不同的组合和顺序，以找到最能表达你想法的提示词。可以包括画风（如“anime style”）、角色特征（如“cute girl with big eyes”）、场景描述（如“sunny park”）等。
简化与精炼：保持提示词简洁明了，避免冗长和复杂的描述。精炼的提示词更容易被模型理解和执行。
测试与优化：在Stable Diffusion模型中输入你的提示词，并观察生成的图像。根据结果，调整和优化你的提示词。尝试添加或删除某些关键词，改变关键词的顺序，或调整参数设置，以获得更满意的结果。

记住，Stable Diffusion模型的结果受到多种因素的影响，包括模型的训练数据、参数设置以及你的提示词选择。因此，可能需要一些尝试和调整才能获得理想的结果。

我们不妨让大语言模型替我们生成一些提示词，如下图所示：