MuseV 是基于扩散模型的虚拟人视频生成框架,具有以下特点:
- 支持使用新颖的视觉条件并行去噪方案进行无限长度生成,不会再有误差累计的问题,尤其适用于固定相机位的场景。
- 提供了基于人物类型数据集训练的虚拟人视频生成预训练模型。支持图像到视频、文本到图像到视频、视频到视频的生成。
- 兼容StableDiffusion 文图生成生态系统,包括 base_model、lora、controlnet 等。
- 支持多参考图像技术,包括IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID。
MuseV支持图生视频、视频生视频,可与腾讯开源的另一款AI工具MuseTalk 一起构建完整的虚拟人生成解决方案。
github上提供了源码搭建运行环境的中文和英文教程,因此本文只详细介绍整合包的获取和使用教程。
关注本文底部公众号回复关键词【muse】获取整合包
MuseV使用教程
获取安装包后解压,双击【01运行程序.bat】去运行
- 提示词和图片生成视频(Text to Video)
运行成功后会在