文生图——stable diffusion生成有趣的动漫图像

Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffusion可以理解为从一张完全的高斯噪音图像开始,根据用户输入的要求,逐步剔除噪音,直到产生出用户所要图片的过程。

接下来,让我们使用stable diffusion模型来生成有趣的动漫图像吧!

step1:stable diffusion模型获取

方法1:stable diffusion官网地址为Stable Diffusion 3 — Stability AI,可以参考网站Home · AUTOMATIC1111/stable-diffusion-webui Wiki (github.com)安装使用模型。本地下载,这个方法需要读者具有较好的电脑设备,最好有英伟达的GPU,详细方法可参考Install and Run on NVidia GPUs。下方我们介绍一下文中方法1的安装步骤:

 方法2:如果本地无法进行安装,则可以尝试使用stable diffusion的国内镜像服务,比如下方这款AUTOMATIC1111/stable-diffusion-webui/NovelAI-Consolidation-Package-3.1: [自带UI启动器]最强云端AI绘画整合版-SDWebUi1.8+SDXL+最新Controlnet+DB训练插件+Roop+AnimateDiffV3+各种插件以及各种依赖模型下载(镜像长期维护更新) - CG (codewithgpu.com)

 也可以通过下方一些网站体验文生图或图生图的功能,不过界面可能会与stable diffusion不同,本文后序讲解将基于stable diffusion原始界面:

step2:动漫图像的获取步骤

此处,我们介绍在本地安装stable diffusion模型后的步骤工作。

首先,利用stable diffusion自带的模型基本上获得不了好看的动漫图像,这时,我们不妨在CamelliaMIx_2.5D - V3 | Stable Diffusion Checkpoint | Civitai中下载CamelliaMIx_2.5D模型,将模型进行导入。c764dc807ede45dbbef9e317d5ee5d04.png

将下载好的模型文件放入\sd.webui\webui\models\Stable-diffusion文件夹中,你会发现该文件夹中有原始的stable diffusion模型,不过之后我们将使用新的模型生成图像。可以看到,在相同提示词下,新的模型将有更符合大众审美的输出:1630fb9199b548c0a7078e51cbffee7b.png7c2448c07cd1406db55b5c26618e28f6.png

step3:如何生成更好的提示词

要使用Stable Diffusion模型生成有趣的动漫图像并获得更好的提示词,你可以遵循以下方法和步骤:

  1. 明确目标:首先,确定你想要生成的动漫图像的主题、风格和氛围。是可爱的、搞笑的、还是冒险的?明确目标有助于你更精准地选择提示词。
  2. 收集灵感:浏览各种动漫作品、插画、艺术作品或在线资源,以收集灵感和参考。注意动漫中的颜色搭配、角色设计、场景构图等元素。
  3. 分析并提取关键词:从你收集的灵感中,分析并提取出与主题、风格、角色、场景等相关的关键词。这些关键词将成为你的提示词的基础。
  4. 构建提示词:使用提取出的关键词来构建你的提示词。尝试使用不同的组合和顺序,以找到最能表达你想法的提示词。可以包括画风(如“anime style”)、角色特征(如“cute girl with big eyes”)、场景描述(如“sunny park”)等。
  5. 简化与精炼:保持提示词简洁明了,避免冗长和复杂的描述。精炼的提示词更容易被模型理解和执行。
  6. 测试与优化:在Stable Diffusion模型中输入你的提示词,并观察生成的图像。根据结果,调整和优化你的提示词。尝试添加或删除某些关键词,改变关键词的顺序,或调整参数设置,以获得更满意的结果。

记住,Stable Diffusion模型的结果受到多种因素的影响,包括模型的训练数据、参数设置以及你的提示词选择。因此,可能需要一些尝试和调整才能获得理想的结果。

我们不妨让大语言模型替我们生成一些提示词,如下图所示:

4102547620684395a5febfe1399d1fa5.png

接下来,我们将这些提示词放入模型中,看看能生成一些什么样的图片吧!

f8c2cc9501ad44eaa059f57d65b29bf3.png

e2090eff4b10497fa325e1af43c78d5a.pnga569dfc2ea5e413ab9c4ab1043f144af.png

9d7b0aea66ec4ceba2479ad4452242cb.pngf55620c9ff964b60aa3f98c0dc75c9ee.png

可以看到模型输出结果还是可以的,使用过模型的友友肯定知道,模型有时候会输出一些“怪异”的图像,这需要我们不断尝试,最后找到合适的生成图。

 

  • 37
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值