Sora刷爆了，先来了解下基本情况

最新推荐文章于 2024-07-31 14:03:43 发布

Jerome_GHW

最新推荐文章于 2024-07-31 14:03:43 发布

阅读量608

点赞数 5

文章标签： ai

本文链接：https://blog.csdn.net/guohengwei/article/details/136224159

版权

2月15日，OpenAI发布的Sora模型确实在文生视频领域取得了显著的进步，其特点和创新性表现在以下几个方面：

视频生成长度：Sora模型能够生成长达1分钟的视频，这相比之前的文生视频模型有了显著的提升。这一长度的视频已经足够涵盖许多实际应用场景，如短视频制作、广告、社交媒体分享等。
3D空间一致性：Sora模型能够在生成的视频中保持3D空间的一致性，这意味着随着摄像机的移动和旋转，人物和场景元素能够在三维空间中保持连贯运动。这一特性使得生成的视频更加自然和逼真，也拓宽了视频生成的可能性。
长期连续性和物体持久性：Sora模型能够在单个视频中生成同一物体的多个镜头，并且一个主题即使暂时离开视野也能保持不变。这一特性在视频编辑和制作中非常重要，可以确保视频内容的连贯性和一致性。
视频扩展能力：Sora模型不仅能够向前后扩展视频，还能够连接两个视频。这一特性使得用户可以轻松地将多个视频片段组合成一个完整的视频，提高了视频制作的灵活性和效率。
模拟数字世界：Sora模型还能够模拟人工操作，例如控制Minecraft游戏中的玩家。这一特性使得Sora模型不仅局限于静态图像的生成，还能够扩展到动态交互场景的模拟，进一步拓宽了文生视频模型的应用领域。

总的来说，Sora模型的发布标志着文生视频技术在实用生产力工具方面的重大突破。其1分钟长度的视频生成能力有望大规模应用在短视频领域，而其扩展视频的能力也有望制作长视频。这一技术的发展或将带来新一轮内容创作产业的革命，为创作者提供更多的创作手段和可能性。同时，我们也期待看到Sora模型在更多领域的应用和拓展。

先来了解一下官网公布的示例（以下是一些简单的翻译）：

1、Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

提示：一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。

https://cdn.openai.com/sora/videos/tokyo-walk.mp4