腾讯MuseV发布让照片会唱歌 HeyGen平替古希腊掌管音乐的神

最新推荐文章于 2024-08-18 22:33:26 发布

KK_crazy

最新推荐文章于 2024-08-18 22:33:26 发布

阅读量806

点赞数 19

文章标签：网络 tcp/ip http mysql 开发语言 java

本文链接：https://blog.csdn.net/weixin_42373241/article/details/137107430

版权

—theme: theme-orange —

文末领取项目地址和Github地址

强烈推荐阅读👆👆👆

MuseV：基于视觉条件并行去噪的无限长高保真虚拟人视频生成

一个实时的高质量口型同步模型，可以与MuseV一起作为完整的虚拟人生成解决方案

MuseV是一个基于扩散的虚拟人视频生成框架，它

https://www.bilibili.com/video/BV1Uj42197WR

提示词：

请在此添加图片描述

(masterpiece, best quality, highres:1),(1girl, solo:1),(beautiful face, soft skin, costume:1),(eye blinks:{eye_blinks_factor}),(head wave:1.3)

请在此添加图片描述

(masterpiece, best quality, highres:1),(1girl, solo:1),(beautiful face, soft skin, costume:1),(eye blinks:{eye_blinks_factor}),(head wave:1.3)

请在此添加图片描述

视频生成类型有限，运动范围有限，部分原因是训练数据类型有限。发布的版本已经在大约 60K 的分辨率下进行了人类文本-视频对的训练。具有更大的运动范围，而在较低分辨率下具有较低的视频质量。倾向于在高视频质量下产生较小的运动范围。在更大、更高分辨率、更高质量的文本视频数据集上进行训练可能会更好。MuseV512*320MuseVMuseVMuseV
水印的出现可能是因为。带有水印的更干净的数据集可能会解决这个问题。webvid
长视频生成类型有限。视觉条件并行降噪可以解决视频生成的累积误差，但目前的方法只适用于相对固定的摄像机场景。
由于时间和资源有限，训练不足的referencenet和IP-Adapter。
结构化代码不足。支持丰富和动态的功能，但具有复杂且未经过修改的代码。这需要时间来熟悉。MuseV

项目地址：