潞晨Open-Sora 1.2发布,16秒720p视频一键生成,质量更高训练成本更低

前言

文生视频技术是近年来 AI 领域最令人瞩目的突破之一。OpenAI 的 Sora 模型展示了令人惊叹的视频生成能力,但其闭源特性限制了技术的普及和发展。而潞晨 Open-Sora 团队则致力于将文生视频技术开源,让更多人能够体验和应用这项技术。

  • Huggingface模型下载:https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3

  • AI快站模型免费加速下载:https://aifasthub.com/models/hpcai-tech

16秒720p高清视频,现在一键生成!

  • 炫酷的科幻大片

技术特点

Open-Sora 1.2 在 720p 高清文生视频质量和生成时长上取得了突破性进展,支持无缝产出任意风格的高质量短片,并继续全部开源。其技术亮点包括:

  • 视频压缩网络: Open-Sora 团队提出了一个创新的视频压缩网络(VAE),该网络在空间和时间两个维度上分别进行压缩。首先在空间维度上进行 8x8 倍的压缩,接着在时间维度上进一步压缩了 4 倍。这种创新的压缩策略既避免了因抽帧而牺牲视频流畅度的弊端,又大幅降低了训练成本,实现了成本与质量的双重优化。

  • 更优的扩散模型算法: 基于 Stable Diffusion 3 的研究成果,Open-Sora 团队提供了一套完整的训练解决方案,包括简单易用的整流(rectified flow)训练、用于训练加速的 Logit-norm 时间步长采样、基于分辨率和视频长度的时间步长采样等。这些技术的整合不仅能够加快模型的训练速度,还能显著减少推理阶段的等待时间,确保用户体验的流畅性。此外,这套训练方案还支持在推理过程中输出多种视频宽高比,满足了多样化场景下的视频素材需求。

  • 更完善的模型评估体系: Open-Sora 团队构建了更完善的模型评估体系,保障模型的稳健性和泛化能力。他们跟踪了 100 张图像和 1k 个视频的校正流评估损失,并使用 VBench 进行自动视频评估,以监控训练过程和评估模型性能。

性能表现

Open-Sora 1.2 能够生成时长 16 秒、分辨率 720p 的高清视频,并支持生成各种风格的短片,例如海浪、森林、人物肖像、赛博朋克、动画等。此外,Open-Sora 1.2 还支持图像到视频的生成和视频扩展功能。

应用场景

Open-Sora 的开源为文生视频技术的应用带来了新的可能:

  • 游戏开发: 游戏开发者可以使用 Open-Sora 生成游戏场景、人物动画等,提升游戏画面表现力。

  • 影视制作: 电影、电视剧等影视作品的制作人员可以使用 Open-Sora 生成各种场景、特效等,为影视作品增添视觉效果。

  • 广告制作: 广告制作人员可以使用 Open-Sora 生成各种场景和动画,提升广告创意和视觉效果。

  • 教育和培训: Open-Sora 可以用于制作教学视频、演示视频等,为用户提供更直观的学习体验。

  • 个人创作: 个人用户可以使用 Open-Sora 制作各种短视频,满足个人创作需求。

总结

Open-Sora 1.2 的开源为文生视频技术的创新和发展注入了强劲的活力。它不仅提供了强大的模型和代码,更重要的是,它为用户提供了自主开发文生视频应用的新技能,让更多人能够参与到文生视频技术的应用中。

模型下载

Huggingface模型下载

https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3

AI快站模型免费加速下载

https://aifasthub.com/models/hpcai-tech

  • 23
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值