原作者:Carl Franzen
文章出处:https://venturebeat.com/ai/openai-unveils-video-ai-model-sora-capable-of-generating-60-second-videos/
编译:裴先生笔记
OpenAI 并不满足于只被称为 ChatGPT 甚至是 LLM 公司:今天,它发布了其新的人工智能文本到视频生成模型Sora的演示,联合创始人兼首席执行官山姆-阿尔特曼(Sam Altman)在 X(前 Twitter)上发帖称,这是一个 “非凡的时刻”。
虽然由于 Altman 在帖子中所说的 “red-teaming”,即对其安全防御、缺陷和误用的对抗性测试,该产品还不能正式供大众使用,但这位创始人确实指出,该产品将提供给 “有限数量的创作者”,并将在晚些时候向公众推广。
OpenAI 推出视频 AI 模型 Sora,能够生成 60 秒的视频片段
Sora_Video_1
视频人工智能模型领域竞争激烈
Sora 正在进入一个竞争激烈的领域,现有的竞争对手初创公司Runway、Pika和Stability AI都提供了专门的人工智能视频生成模型,谷歌等中坚力量也展示了其 Lumiere 模型功能。
不过,OpenAI 今天分享的 Sora 视频样本在分辨率的清晰度、动作的流畅性、人体解剖学和物理世界的准确性,以及最重要的运行时间方面都非常突出。
Runway 和 Pika 一次只能生成 4 秒钟的视频,还可以选择扩展,而 OpenAI 的 Sora 则不同,它可以直接生成 60 秒钟的视频。
Altman和 OpenAI 领导层以及Sora 团队的其他成员(包括研究员 Will Depue)正在 Twitter/X 上收集用户的提示信息,他们正在通过 Sora 对这些信息进行处理,作为该模型新功能的现场众包演示。因此,如果您有兴趣的话,可以向他们提交一些资料(我已经提交了)。
比起那些天马行空的视频,索拉还能复制人类生活中平凡而又可识别的瞬间,比如从高架列车上观看城市景观,或者一个女人和一只猫在床上的家庭录像,这些视频的逼真程度令人震惊。
同样令人印象深刻且可能令人震惊的是,OpenAI 研究员比尔-皮布尔斯(Bill Peebles)指出,Sora 将通过 “模拟一切 “来帮助人们探索 AGI。
在美国联邦机构再次推动对人工智能进行监管,特别是针对其欺诈和深度伪造真人的可能性之际,Sora 的出现似乎不仅是 OpenAI 的一个里程碑,也是整个科技和媒体行业乃至整个人类的一个里程碑–不过是好是坏,还有待观察。