Stability AI发布3D模型生成AI稳定视频3D

稳定性AI近期发布 稳定的3D视频 (SV3D),一种可以从单个 2D 图像生成 3D 网格对象模型的 AI 模型。 SV3D 是基于 稳定的视频扩散 模型并在 3D 对象生成基准上产生最先进的结果.

SV3D 解决了新颖视图合成 (NVS) 的问题,它尝试在给定对象的一个​​或多个 2D 图像的情况下生成该对象不可见的部分:例如,在给定对象正面图像的情况下生成对象背面的视图。 Stability AI 利用其现有的稳定视频扩散模型,其中包括摄像机控制能力,使其能够生成 轨道 视频,其中相机围绕感兴趣的对象转一圈。 该模型使用从 3D 对象渲染的数据集进行了微调 奥布贾宇宙 数据集。 当评估在 地球同步轨道OmniObject3D 在基准测试中,SV3D 的性能优于基准模型,并实现了新的最先进性能。 根据稳定人工智能:

稳定视频 3D 引入了 3D 生成方面的重大进步,特别是在新颖的视图合成方面。 以前的方法常常要解决有限的视角和输出不一致的问题,与此不同的是,稳定视频 3D 能够从任何给定角度提供连贯的视图,并具有熟练的概括能力。 此功能不仅增强了姿态可控性,还确保了多个视图中对象外观的一致性,进一步改善了真实且准确的 3D 生成的关键方面.

InfoQ 报道了 SV3D 的底层技术, 稳定的视频扩散 (SVD),于 2023 年发布。Stability AI 也在晚些时候发布了 3D 生成的早期尝试 2023: 稳定零位123. 这是基于他们的 Stable Diffusion 1.5 文本到图像模型。 这项工作的灵感来自于开源 零123 3D一代模型创建 艾伦人工智能研究所 (AI2) 作为 Objaverse 项目的一部分.

Zero123 和稳定 Zero123 方法的一个缺点是这些模型“未设计为多视图一致”,因为它们一次仅创建一帧的新视图,因此缺乏 3D 生成的“最关键要求”。 相比之下,SVD 模型经过显式训练以生成一致的多帧视频。 另一个优点是它允许摄像机控制,这不仅仅可以生成简单的轨道 3D 视频。 Stability AI 表示:“据我们所知,SV3D 是第一个基于视频扩散的框架,用于 576x576 分辨率的可控多视图合成."

为了训练 SV3D,Stability AI 使用了 Objaverse 中的对象,并从不同的摄像机角度渲染了每个对象的 21 帧。 他们训练了 SV3D 的三个版本:一种仅使用静态轨道进行训练,一种仅使用动态轨道进行训练,第三种同时使用静态和动态轨道进行训练。 第三个模型比其他两个模型取得了更好的评估指标.

在有关 SV3D 的黑客新闻帖子中,用户 讨论了可能的应用 模型的。 一位用户写道:

如果显示的动画具有代表性,那么网格输出很可能足以在 3D 打印机中使用。 期待尝试这个.

SV3D模型权重 可在 Huggingface 上使用,仅供非商业用途。 该模型可通过 Stability AI 用于商业用途 会员计划.

  • 14
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值