1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD

Hyper-SD 使用了当前最先进的 Stable Diffusion 模型加速,可以在1、2、4、8个采样步骤下生成高质量的大尺寸图片,它通过Lora模型的方式发布,兼容 SDXL 和 SD1.5 的各类模型。

先看官方发布的这个效果对比:Hyper-SDXL出图的质量确实很优秀!

在这里插入图片描述

Hyper-SD 介绍

Hyper-SD 由字节跳动开源,使用了神经网络的模型蒸馏技术从 SDXL Base 1.0 和 Stable-Diffusion v1-5 模型中提取出了高质量的图像特征信息。

具体来说,字节团队提出了一种新颖的框架,协同整合了ODE轨迹保持和ODE轨迹重构的优势,既保证了新模型的性能,又提升提升了新模型的效率。 首先,它引入了轨迹分段一致性蒸馏,在预先定义的时间步长段内逐步进行一致性蒸馏,从而从更高层次上促进了原始ODE轨迹的保留。 其次,它将人类反馈学习融入模型,以提升低步长条件下的性能,并减轻蒸馏过程中产生的性能损失。第三,它将评分提炼技术融入其中,进一步提升模型在低步骤生成方面的能力,并首次尝试利用统一的LoRA支持所有步骤的推理过程。

ODE轨迹指的是扩散模型在训练时添加噪声和去燥的过程。ODE轨迹保持指的是训练时尽量复现原模型的ODE轨迹,这样可以尽量保持原模型的性能。ODE轨迹重构指的是训练时在保障新模型输出与原模型相近的前提下,优化ODE轨迹。

Hyper-SD 在 SDXL 和 SD1.5 的1至8步推理过程中均实现了良好性能。例如,在1步推理中,Hyper-SDXL 在CLIP评分上比 SDXL-Lightning 高出0.68,在Aes评分上高出0.51。

安装 Hyper-SD

手动安装

Hyper-SD的安装比较简单,我们只需要在ComfyUI的基础能力上增加一个新的采样调度器,然后再下载相关的模型,就可以了。

  • TCD采样调度器:你可以手动安装,也可以通过安装工作流缺失节点来完成。插件地址:github.com/JettHu/Comf…
  • Hyper-SD模型:Hyper-SD模型都是Lora模型,目前官方只发布了ComfyUI的使用方法,下载后放到 ComfyUI 的LoRA模型目录既可以了。

全都安装完了,不要忘了重启。对安装方法还不熟悉的同学,请看这篇文章:ComfyUI 完全入门:必备插件

模型和工作流下载地址见文末。

使用镜像

在 AutoDL 上发布了一个 ComfyUI 的镜像,已经内置了 Hyper-SD 的模型和工作流,填了很多坑,可以一键开启使用,无需自己费力部署。

AutoDL是一个云计算平台,提供显卡服务器租用服务,可按小时付(1-2元左右),显卡价格相比阿里云、腾讯云有明显的优势,我一直在用,推荐本地硬件性能不足的同学试试。

镜像地址:www.codewithgpu.com/i/comfyanon…

在镜像地址页面,点击右下角的“AutoDL创建实例”:

也可以在实例创建页面选择社区镜像:yinghuoai-ComfyUI

在这里插入图片描述

GPU型号建议选择RTX 3090、4090等,性能比较强。

镜像实例创建后,里边有一个启动器,按照提示即可一键启动。

使用Hyper-SD

Hyper-SD 的推理加速是通过 LoRA 模型实现的,官方发布了多个 LoRA 模型供我们使用。这里我介绍其中最新的两种 LoRA 模型:Unified LoRA 和 CFG LoRA。

Unified LoRA

先来看 Unified LoRA(统一LoRA),所谓 统一LoRA 就是我们可以只使用一个模型,就能执行 1-8步的推理,在最低的1步推理下图片质量也是有所保证的,而且随着推理步数的增加,图像中的元素越来越丰富,事物的个性特征也会更加明显。

这个工作流中的节点不多,我这里做了一个简单的标注,如下图所示。文末提供工作流的下载方式。

这里有几点注意下:

  • TCD采样调度:TCD采样调度器是搭配 Hyper-SD 统一LoRA 模型必备的,它的时间调度是专门调整过的;
  • 负向提示词不需要填写;
  • CFG引导设置为1;
  • 图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

这个模型有什么用?一个字快,比如根据涂鸦实时或准实时生成图片:

CFG LoRA

CFG LoRA 可以让我们使用更强的提示词引导,包括负向提示词。官方训练的模型可以支持5-8的CFG系数。

工作流标注如下:

这里有几点注意下:

1、LoRA模型:选择的是Hyper-SD CFG LoRA,这里使用的是8步模型,采样步数也要设置为8。最新的有12步模型,图片质量更高一些,但是生成时间也更长。

2、支持反向提示词:比如我们这里的 black hair,就是不要黑色的毛发。

3、采样低矮度还是使用 TCD采样调度器。

4、CFG需要设置为 5-8,具体值需要自己测试,选择适合自己模型和提示词的。

5、图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

资源下载

模型

模型官方下载地址:huggingface.co/ByteDance/H…

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉12000+AI关键词大合集👈

在这里插入图片描述

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 15
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值