ControlNet作者再现神迹,发布FramePack——让消费级显卡也能快速生成视频

FramePack是一种下一帧(下一帧部分)预测神经网络结构,可逐步生成视频。

在这里插入图片描述

FramePack将输入上下文压缩为恒定长度,因此生成工作量与视频长度无关。
即使在笔记本电脑 GPU 上,FramePack 也能使用 13B 模型处理大量帧。

FramePack可以用更大的批次规模进行训练,类似于图像扩散训练的批次规模。

Video diffusion, but feels like image diffusion.

要求:

  • 支持 fp16 和 bf16 的 RTX 30XX、40XX、50XX 系列 Nvidia GPU。不测试 GTX 10XX/20XX。
  • Linux 或 Windows 操作系统。
  • 至少 6GB GPU 内存。

安装

Windows一键安装包,作者正在TODO

Linux

conda create -n FramePack python=3.10 -y
conda activate FramePack 
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install -r requirements.txt

要启动图形用户界面,请运行

python demo_gradio.py # --server 0.0.0.0

软件支持 PyTorch attention、xformers、flash-attn 和 sage-attention。默认情况下,它只使用 PyTorch attention。如果你知道如何安装,也可以安装这些注意力内核。

例如,安装 sage-attention (linux):

pip install sageattention==1.0.6

不过,强烈建议您先在不使用sage-attention的情况下进行尝试,因为sage-attention会影响效果,尽管影响很小。

UI操作

上传图片

请添加图片描述

prompt:

The man dances energetically, leaping mid-air with fluid arm swings and quick footwork.

在这里插入图片描述

代码

https://github.com/lllyasviel/FramePack

模型

from huggingface_hub import snapshot_download
snapshot_download(repo_id="hunyuanvideo-community/HunyuanVideo")
snapshot_download(repo_id="lllyasviel/flux_redux_bfl")
snapshot_download(repo_id="lllyasviel/FramePackI2V_HY")
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值