前段时间字节正式发布了文生图 SDXL-Lightning 微调模型, 采用了新的渐进式对抗蒸馏(Progressive Adversarial Distillation)技术,能将计算时间和成本降至此前的十分之一,SDXL-Lightning 能提速 10 倍在 2~4 步内生成高质量及高分辨率的图像。SDXL-Lightning demo 基于 ComfyUI,也同样支持 SD WebUI。本文介绍 SDXL-Lightning 快速生成 1024 高清大图的本地实现方法,体验其超出 SDXL-Turbo 和 LCM 的效果以及在 ComfyUI 中的自建 workflow 的步骤和方法。本文篇幅有所压缩,完整内容请见「博客」,模型也在博客空间备好,无需魔法直接下载。
简介
SDXL-Lightning 是一个由 ByteDance(字节跳动) 开发的文生图微调模型,其主要贡献在于其高速的生成能力和轻量化的设计,有关模型和论文也都已经开源。
论文: SDXL-Lightning: Progressive Adversarial Diffusion Distillation
模型: huggingface.co/ByteDance/SDXL-Lightning
当前,SDXL-Lightning 提供了 1步、2步、4步和8步的蒸馏模型和 2步、4步和8步 的 Lora 模型(类似LCM),官方 demo 对比见下图。SDXL-Lightning 1、2、4、8步都能表现的非常好,SDXL 则中规中矩,需要 32 步才能完成,而 Turbo 和 LCM 在1步的时候表现的不太稳定,且只能生成 512*512 分辨率的图。
本地部署
首先在Github ComfyUI仓库下载最新的 ComfyUI 包,分为 cuda 118 和 121 不同的版本。结合自身 nvidia cuda 版本下载后解压。
在sdxl-lightning官方发布页,点开「files and versions」就可以下载 1、2、4、8 微调模型或 lora 模型。这里建议下载 all in one 版本,也就是名称为 sdxl_lightning_Nstep.safetensors 的文件。如下图选择即可,可以都下载,也可以仅下载一个对应步数的模型。本文以 4 步模型为例。
同时下载官方制作好的 wokflow 文件,位于comfyui目录下,默认下载 sdxl_lightning_workflow_full.json 即可,需要尝试1步出图的话可以下载 sdxl_lightning_workflow_full_1step.json。
官方发布的模型默认基于 ComfyUI,模型下载解压后将模型、workflow 文件拷贝入 comfyui 解压目录 models 下的 checkpoints 目录。workflow 文件可以放在其他目录,打开 ComfyUI 后手动加载,和模型放在同一文件夹下可以自动加载。
SDXL-Lightning绘图
双击运行 ComfyUI 下的 run_nvidia_gpu.bat 即可开始使用GPU 文生图,如果使用 CPU,则双击运行 run_cpu.bat。
打开 sdxl-lightning 默认的workflow 界面后,直接点击「Queue Prompt」,就会采用默认填写的 “a girl smiling” 生成一张 1024*1024 的图像。即便采用4步模型,也确实比使用标准 sdxl 模型快。
延伸阅读
- 生成SD提示词
提示词可以参考已有的大量的 SD 提示词公开库,也可以使用 ChatGPT 生成,「原文」提供了参考 ChatGPT 提示词。
- 编写workflow
ComfyUI中编写workflow类似拖拽式的网页搭建,是一个搭积木的过程,而不是从零开始去写一个 json 文件。因此,comfyui 的 workflow 编写也是非常简单的,例如以下针对用于创建 logo 的 lora 模型的workflow,一共8个节点,可以在 comfyui 界面中一点点右键选择创建、拖拽、连线连接,画过 visio 或其他任何流程图的一定轻车熟路。
在comfyui中编写workflow,以C站logo类的热门LogoRedAF为例,3个步骤:
- C站下载LogoRedAF模型,可在C站搜索关键字 logo
- Huggingface或github下载SDXL_base_1.0模型
- 将logoRedAF和SDXL_base_1.0模型分别拷贝如 comfyui 下 models 目录下的 checkpoints 和 loras 目录中
相比而言,comfyui 貌似没有 webui 那么好上手,但实际使用也是非常简便的。同时 comfyui 默认支持使用 cpu,使用 workflow 也非常便于梳理流程、进一步学习 aigc 文生图模型。
更多精彩内容,敬请关注gangkeji哦...