Meta推出Movie Gen 旗下迄今最先进的视频生成AI模型

吴脑的键客

于 2024-10-05 13:12:36 发布

阅读量563

点赞数 12

分类专栏： AI作画文章标签：音视频人工智能 AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41446370/article/details/142713507

版权

AI作画专栏收录该内容

115 篇文章

订阅专栏

Meta 今天发布了 MovieGen 系列媒体基础AI模型，该模型可根据文本提示生成带声音的逼真视频。 MovieGen 系列包括两个主要模型： MovieGen Video 和 MovieGen Audio。

在这里插入图片描述
MovieGen Video 是一个具有 300 亿个参数的变换器模型，可根据单个文本提示生成高质量、高清晰度的图像和视频，生成的视频可长达 16 秒，每秒 16 帧。

MovieGen Audio 是一个 130 亿参数的变压器模型，可以接收视频输入和可选的文本提示，并生成与输入视频同步的长达 45 秒的高保真音频。这种新的音频模型可以生成环境音效、器乐背景音乐和 Foley 音效。 Meta 声称它在音频质量、视频与音频对齐和文本与音频对齐方面都能提供最先进的效果。

在这里插入图片描述

这些模型不仅仅用于创建全新的视频。它们可用于使用简单的文本提示编辑现有视频。 MovieGen 还允许用户进行本地化编辑，如添加、删除或替换元素，以及进行背景或样式更改等全局更改。例如，如果您有一段某人扔球的视频，并配有简单的文字提示，您可以将视频改为某人扔西瓜，同时保留原始内容的其余部分。

MovieGen 模型将允许用户创建个性化视频。通过使用人物图像和文字提示，这些模型可以生成保留人物特征和动作的个性化视频。 Meta 声称，这些模型在视频中的人物保护和自然运动方面提供了最先进的成果。

在这里插入图片描述
Meta 声称，与其他视频生成模型（包括 OpenAI Sora 和 Runway Gen-3）相比，这些模型能生成更好的视频。 Meta 目前正与创意专业人士合作，在公开发布之前进一步改进该模型。

了解更多/Meta

感谢大家花时间阅读我的文章，你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容，请多多关注我的动态！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。