[AIGC] Stable Diffusion 如何使用 VAE 改善眼睛和脸部

本文介绍了如何使用StableDiffusion中的改进版VAE(如EMA和MSE)来增强图像渲染,特别是眼睛细节。VAE在256x256和512x512分辨率下提供细微但明显的提升,对于希望优化艺术作品的人来说是一个可选的工具。
摘要由CSDN通过智能技术生成

英文原文:https://stable-diffusion-art.com/how-to-use-vae/

VAE 是稳定扩散 1.4 或 1.5 模型的部分更新,可以使眼睛渲染得更好。我将解释什么是 VAE、您可以期待什么、在哪里可以获得它以及如何安装和使用它。

什么是VAE?

VAE 代表variational autoencoder(变分自动编码器)。它是神经网络模型的一部分,可在较小的潜在空间之间对图像进行编码和解码,从而使计算速度更快。

我需要 VAE 吗?

您不需要安装 VAE 文件来运行 Stable Diffusion - 您使用的任何模型,无论是 v1、v2 还是自定义模型,都已经有默认的 VAE。

当人们说下载和使用 VAE 时,他们指的是使用它的改进版本。当模型训练器使用附加数据进一步微调模型的 VAE 部分时,就会发生这种情况。他们没有发布一个大文件的全新模型,而是只发布已更新的一小部分。

使用VAE有什么效果?

通常,它很小。改进的 VAE 可以更好地从潜在空间解码图像。精细细节得到更好的恢复。它有助于渲染所有细节都很重要的眼睛和文本。

Stability AI 发布了两种经过微调的 VAE 解码器变体:EMA(Exponential Moving Average) 和 MSE(Mean Square Error)。 (指数移动平均值和均方误差是衡量自动编码器性能的指标。)

请看下面的比较

在这里插入图片描述
Stability AI EMA、MSE 和原始解码器之间的比较。 (256×256 图像)

您应该使用哪一个?对 256×256 图像的稳定性评估是,EMA 生成的图像更清晰,而 MSE 的图像更平滑。 (这符合我自己的测试。)

在我自己使用 512×512 图像对 Stable Diffusion v1.4 和 v1.5 进行的测试中,我发现某些图像中的眼睛渲染效果有了很大的改进,尤其是当面部较小时。我没有看到渲染文本有任何改进,但无论如何,我认为没有多少人因为这个原因而使用稳定扩散。

无论如何,新的 VAE 性能都会更差。要么做得更好,要么什么都不做。

下面是使用稳定扩散 v1.5 模型的原始、EMA 和 MSE 之间的比较。 (提示可以在这里找到。)放大并比较差异。

在这里插入图片描述
使用 SD v1.5 比较原始、EMA 和 MSE 之间的 VAE。请注意,原始图像中的乱码眼睛已恢复。

对文本生成的改进并不那么明显(在提示中添加了“举着一个表示稳定扩散的标志”):

在这里插入图片描述
原始、EMA 和 MSE 之间的 VAE 比较。文本渲染的改进尚不清楚。

您还可以将这些 VAE 与自定义模型一起使用。我用一些动漫模型进行了测试,但没有看到任何改进。我鼓励您自己进行测试。

最后一点,EMA 和 MSE 与 Stable Diffusion v2.0 兼容。您可以使用它们,但效果很小。 2.0在渲染眼睛方面已经非常擅长了。也许他们已经将改进纳入到模型中。

我应该使用 VAE 吗?

如果您对所获得的结果感到满意,则无需使用 VAE。例如,您已经在使用 CodeFormer 等面部修复来修复眼睛。

如果您愿意采取所有可以获得的小改进,那么您应该使用 VAE。您只需要经历一次设置的麻烦。之后,艺术创作工作流程保持不变。

如何使用VAE?

VAE 可以在快速入门指南中包含的 Colab Notebook 中使用。

下载

目前,Stability发布了两个VAE的改进版本。以下是直接下载链接。

EMA VAE 下载链接

MSE VAE 下载链接

安装

此安装说明适用于 AUTOMATIC1111 GUI。将下载的VAE文件放入目录中

stable-diffusion-webui/models/VAE

适用于 Linux 和 Mac 操作系统

为了方便起见,请在 Linux 或 Mac OS 中的 stable-diffusion-webui 目录下运行以下命令,下载并安装 VAE 文件。

wget https://huggingface.co/stabilityai/sd-vae-ft-ema-original/resolve/main/vae-ft-ema-560000-ema-pruned.ckpt -O models/VAE/vae-ft-ema-560000-ema-pruned.ckpt
wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.ckpt -O models/VAE/vae-ft-mse-840000-ema-pruned.ckpt

使用

要在 AUTOMATIC1111 GUI 中使用 VAE,请单击左侧的“设置”选项卡,然后单击“VAE”部分。

在 SD VAE 下拉菜单中,选择您要使用的 VAE 文件。

在这里插入图片描述
按顶部的红色大应用设置按钮。您应该看到该消息

Settings: sd_vae applied

加载成功后,在“设置”选项卡中。

下拉菜单中的其他选项有:

  • None:使用模型自带的原始VAE。
  • Auto:请参阅此帖子了解行为。我不建议初学者使用 Auto,因为很容易混淆使用的是哪个 VAE。

专业提示:如果找不到设置,请单击左侧的“显示所有页面”。所有设置都将显示在一个页面上。使用 Ctrl-F 查找设置。

总结

我们已经介绍了如何使用 Stability AI 发布的两种改进的 VAE 解码器。它们对渲染眼睛提供了微小但显着的改进。您可以决定是否要使用它。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"AIGC稳定扩散"是指人工智能全球中心(AIGC)通过稳定的扩散方法来推广和普及人工智能技术。 首先,AIGC稳定扩散的目标是将人工智能技术应用于各个领域,从而促进社会的发展和进步。通过稳定的扩散,AIGC能够确保人工智能技术的普及和应用是在可靠和可持续的基础上进行的。 其次,在AIGC稳定扩散的过程中,重点关注技术的质量和适用性。AIGC积极筛选和评估现有的人工智能技术,并与专家和机构合作改进和优化。通过确保技术的高质量和适用性,AIGC能够提供可靠和稳定的解决方案,满足不同行业和领域的需求。 另外,AIGC稳定扩散还注重普及和教育。AIGC通过举办培训、研讨会和交流活动,向各界人士普及人工智能技术的基础知识和应用方法。定期发布人工智能技术的最新发展和成果,提供资源和支持,帮助更多的人了解和应用人工智能技术。 最后,AIGC稳定扩散还重视合作和共享。AIGC与各国和地区的研究机构、企业和政府合作,共享资源和经验,促进人工智能技术的交流和发展。通过建立良好的合作网络,AIGC能够更好地推广人工智能技术,建立全球范围内的合作关系,实现共同的发展目标。 总而言之,AIGC稳定扩散是为了推广和普及人工智能技术而采取的稳定方法。通过质量和适用性的保证、普及和教育的重视,以及合作和共享的策略,AIGC致力于实现人工智能技术的广泛应用,推动社会的发展和进步。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值