阿里发布 FLUX.1-Turbo-Alpha:基于FLUX.1-dev、8步提炼Lora

近日,阿里妈妈创意团队发布了 FLUX.1-Turbo-Alpha,这是基于 FLUX.1-dev 模型训练的一款8步蒸馏 Lora 模型。

该模型采用了多头判别器,显著提高了蒸馏的质量,支持文本到图像生成、修复控制网等多种 FLUX 相关的应用。团队建议在使用时将引导尺度设置为3.5,Lora 尺度为1,未来还会推出更低步数的版本。

在这里插入图片描述
FLUX.1-Turbo-Alpha 可以直接与 Diffusers 框架结合使用。用户只需通过几行代码便能加载模型并生成所需的图像。例如,你可以创建一个有趣的场景:一只微笑的树懒穿着皮夹克、牛仔帽、格子裙和蝴蝶结,站在一辆画有城市风景的光滑大众面包车前。只需简单调整参数,就能在1024x1024的分辨率下生成高质量的图像。

在这里插入图片描述
此外,该模型也兼容 ComfyUI,可以用于文本到图像的快速工作流程,或在修复控制网中实现更高效的生成效果。通过这种技术,生成的图像能够很好地跟随原始输出,提升用户的创作体验。

FLUX.1-Turbo-Alpha 的训练过程同样令人瞩目。该模型在超过100万幅开源和内部资源的图像上进行训练,具备6.3以上的美学评分,且分辨率均高于800。团队在训练过程中采用了对抗训练的方法,以提升图像质量,并针对每个变换器层增加了多头的设计。训练过程中的引导尺度固定为3.5,时间偏移则设为3,使用了混合精度 bf16,并设定学习率为2e-5,批量大小为64,图像尺寸为1024x1024。

FLUX.1-Turbo-Alpha 的推出,标志着阿里妈妈在图像生成领域的又一次突破,推动了人工智能技术的普及与应用。

项目入口:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

Diffusers

import torch
from diffusers.pipelines import FluxPipeline

model_id = "black-forest-labs/FLUX.1-dev"
adapter_id = "alimama-creative/FLUX.1-Turbo-Alpha"

pipe = FluxPipeline.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16
)
pipe.to("cuda")

pipe.load_lora_weights(adapter_id)
pipe.fuse_lora()

prompt = "A DSLR photo of a shiny VW van that has a cityscape painted on it. A smiling sloth stands on grass in front of the van and is wearing a leather jacket, a cowboy hat, a kilt and a bowtie. The sloth is holding a quarterstaff and a big book."
image = pipe(
            prompt=prompt,
            guidance_scale=3.5,
            height=1024,
            width=1024,
            num_inference_steps=8,
            max_sequence_length=512).images[0]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值