Sora：继ChatGPT之后，OpenAI的又一力作

最新推荐文章于 2024-02-24 11:30:00 发布

深度人工智能

最新推荐文章于 2024-02-24 11:30:00 发布

阅读量1.8k

点赞数 15

分类专栏：技术趋势 AIGC 行业应用文章标签：人工智能

本文链接：https://blog.csdn.net/DeepAIedu/article/details/136134198

版权

Sora视频生成模型因其出色的质量和长达60秒的时长脱颖而出，解决了现有模型的痛点。它通过大规模训练掌握物理规律，可用于智能机器人和自动驾驶等领域，展现出变革时代的潜力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于Sora的报道，相信很多圈内朋友都已经看到了来自各大媒体铺天盖地的宣传了，这次，对于Sora的宣传，绝不比当初ChatGPT的宣传弱。自OpenAI发布了GPT4之后，就已经有很多视频生成模型了，不过这些模型要么生成的质量堪忧，要么生成的时间太短，比如Gen-2、Pika、Runway、VideoPoet、VideoLDM、Animate Anyone、MagicVideo-V2等视频，很难同时达到高质量生成效果和更长的时长。

Sora之所以出圈，主要有两点，这两点就是之前其他视频生成模型无法解决的痛点，即视频生成的质量和时长。Sora生成的视频呈现出的是大片既视感，无论是镜头变化，还是光影色彩的转变，以及细微到纹理结构的变化，都呈现出了专业摄影师级别的效果；而它生成的视频时长竟然达到了60秒，在此之前，生成最长时长的视频模型VideoPoet也只能生成10秒的时长。这也是为什么当山姆・奥特曼的消息放出后，看到 OpenAI 工程师第一时间展示的 AI 生成视频效果时，人们纷纷表示感叹：好莱坞的时代结束了？

接下来，我们将简单介绍一下Sora的技术实现过程，以及Sora对行业的影响。根据OpenAI的介绍和愿景，Sora不只是一个简单的视频生成工具，而是一个能够改变时代的“世界模型”，Sora的开发工程师表示，Sora通过观察大量数据，可以学会许多关于世界的物理规律，这可以被用来模拟真实世界中的事件发生时的状况，比如智能机器人，自动驾驶等。

比如下面这段提示，“Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.”

根据以上提示内容，生成的视频是一个动画场景的特写镜头，一个毛