Sora是否能颠覆视频制作行业？一文带你了解

最新推荐文章于 2024-07-12 09:28:30 发布

就是Jim

最新推荐文章于 2024-07-12 09:28:30 发布

阅读量1k

点赞数 14

文章标签：音视频

本文链接：https://blog.csdn.net/2401_82571103/article/details/137183014

版权

OpenAI的新型AI系统Sora能生成高质量的短视频，结合文本和图像生成工具，引发关注。然而，其可能带来的社会和道德风险，如假新闻、深度伪造和版权问题，使得人们对这一技术的发展持谨慎态度。

摘要由CSDN通过智能技术生成

一个月前OpenAI宣布了一款名为Sora的新生成式人工智能系统，该系统可以根据文本提示生成短视频。虽然Sora尚未向公众开放，但迄今为止发布的高质量样本已经引起了兴奋和担忧的反应。

OpenAI发布的样本视频（该公司称这些视频是由Sora直接制作，未经修改）显示了提示的输出，例如“两艘海盗船在一杯咖啡内航行时互相战斗的逼真特写视频”和“加利福尼亚州的历史镜头”淘金热期间”。乍一看，由于视频、纹理、场景动态、摄像机运动的高质量以及良好的一致性，通常很难看出它们是由人工智能生成的。OpenAI首席执行官Sam Altman还在X（以前的Twitter）上发布了一些根据用户建议的提示生成的视频，以展示Sora的功能。

一、Sora如何运作？

Sora在所谓的“扩散变压器模型”中结合了文本和图像生成工具的功能。

Transformer是Google于2017年首次推出的一种神经网络。它们因在ChatGPT和Google Gemini等大型语言模型中的使用而闻名。另一方面，扩散模型是许多人工智能图像生成器的基础。他们的工作原理是从随机噪声开始，迭代到适合输入提示的“干净”图像。一系列图像显示了静态中出现的城堡图片。

Sora使用变压器架构来处理帧之间的关系。虽然Transformer最初被设计为在表示文本的标记中查找模式，但Sora相反使用表示小块空间和时间的标记。

Sora并不是第一个文本转视频模型。早期的模型包括Meta的Emu、Runway的Gen-2、Stability AI的Stable Video Diffusion以及最近Google的Lumiere。几周前发布的Lumiere声称可以制作比其前身更好的视频。但至少在某些方面，Sora似乎比卢米埃更强大。

Sora可以生成分辨率高达1920×1080像素和多种宽高比的视频，而Lumiere仅限于512×512像素。Lumiere的视频长度约为5秒，而Sora的视频长达60秒。Lumiere无法制作由多个镜头组成的视频，而Sora可以。据报道，与其他模型一样，Sora也能够执行视频编辑任务，例如从图像或其他视频创建视频、组合不同视频的元素以及及时扩展视频。

这两种模型都会生成大致真实的视频，但可能会产生幻觉。卢米埃尔的视频可能更容易被认为是人工智能生成的。Sora的视频看起来更有活力，元素之间有更多的互动。然而，在许多示例视频中，仔细检查后就会发现不一致之处。

二、Sora的发展前景

目前，视频内容是通过拍摄现实世界或使用特效来制作的，这两种方式都可能成本高昂且耗时。如果Sora以合理的价格上市，人们可能会开始使用它作为原型设计软件，以更低的成本将想法可视化。根据我们对Sora功能的了解，它甚至可以用于为娱乐、广告和教育领域的某些应用程序创建短视频。

OpenAI关于Sora的技术论文的标题是“视频生成模型作为世界模拟器”。该论文认为，像Sora这样的更大版本的视频生成器可能是“物理和数字世界以及生活在其中的物体、动物和人的有效模拟器”。如果这是正确的，未来的版本可能会在物理、化学甚至社会实验方面具有科学应用。例如，人们也许能够测试不同规模的海啸对不同类型的基础设施以及附近人们的身心健康的影响。实现这种水平的模拟非常具有挑战性，一些专家表示像Sora这样的系统根本无法做到这一点。

一个完整的模拟器需要计算宇宙最详细水平的物理和化学反应。然而，在未来几年内，模拟世界的粗略近似并制作人眼逼真的视频可能是可以实现的。

三、Sora存在的问题

人们对Sora这样的工具的主要担忧是其社会和道德影响。在一个已经被虚假信息困扰的世界中，像Sora这样的工具可能会让事情变得更糟。很容易看出，生成您可以描述的任何场景的逼真视频的能力如何可以用来传播令人信服的假新闻或对真实镜头提出质疑。它可能会危及公共卫生措施，被用来影响选举，甚至可能因潜在的虚假证据而给司法系统带来负担。视频生成器还可能通过深度伪造（尤其是色情内容）对目标个人造成直接威胁。这些可能会对受影响个人及其家人的生活产生可怕的影响。

除了这些问题之外，还存在版权和知识产权问题。生成式人工智能工具需要大量数据进行训练，而OpenAI尚未透露Sora的训练数据来自何处。大型语言模型和图像生成器也因此受到批评。在美国，一群著名作家因可能滥用他们的材料而起诉OpenAI。该案认为，大型语言模型和使用它们的公司正在窃取作者的作品来创建新内容。

近年来，技术超越法律已经不是第一次了。例如，社交媒体平台审核内容的义务问题在过去几年引发了激烈的争论——其中大部分围绕《美国法典》第230条展开。虽然这些担忧是真实存在的，但根据过去的经验，我们预计它们不会停止视频生成技术的开发。OpenAI表示，在向公众开放Sora之前，它正在“采取几项重要的安全措施”，包括与“错误信息、仇恨内容和偏见”领域的专家合作，以及“构建帮助检测误导性内容的工具”。

本文来源：www.sora008.com

就是Jim

关注

14
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
Sora是否能颠覆视频制作行业？一文带你了解

OpenAI发布的样本视频（该公司称这些视频是由Sora直接制作，未经修改）显示了提示的输出，例如“两艘海盗船在一杯咖啡内航行时互相战斗的逼真特写视频”和“加利福尼亚州的历史镜头”淘金热期间”。该论文认为，像Sora这样的更大版本的视频生成器可能是“物理和数字世界以及生活在其中的物体、动物和人的有效模拟器”。OpenAI表示，在向公众开放Sora之前，它正在“采取几项重要的安全措施”，包括与“错误信息、仇恨内容和偏见”领域的专家合作，以及“构建帮助检测误导性内容的工具”。
复制链接

扫一扫