OpenAI推出生成式视频划时代的模型：Sora惊艳登场，引爆行业变革！这次，它又将颠覆哪些领域？

最新推荐文章于 2024-02-24 11:30:00 发布

程序视点

最新推荐文章于 2024-02-24 11:30:00 发布

阅读量1.8k

点赞数 44

分类专栏： AIGC 文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49562392/article/details/136133670

版权

AIGC 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

哈喽，大家好,我是程序视点的小二哥！

前言

就在今天，一个消息把我给震惊呆了：

Sora

奥特曼发布OpenAI首个视频生成模型Sora。完美继承DALL·E 3的画质和遵循指令能力，能生成长达1分钟的高清视频。

Sora

就在昨天~就是昨天，我还在和AI的小伙伴讨论说“目前的AI，在文生视频方面，还停留在5、6秒的视频”！

结果一觉醒来，就被OpenAI教育啦~ 啪啪打脸呀~

之前一丁点消息不放，一丁点预热也没有，直接王炸推出Sora！

之前我们常说AI给程序员带来了很大的影响，现在想想诸如虚拟拍摄、特效、广告…这些行业会有多大的影响！

一将功成，万骨枯！按照这个速度发展AI，后续会怎样?

用三个词来总结下Sora:

60s超长长度
单视频多角度镜头
世界模型

就这特点，在一年前，那是想都没想过的！现在，就现在，小二哥想对对自己说是 ”你不入AI，谁入AI？你的竞争对手吗？“

带你看“文生视频”

AI想象中的龙年春节，红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童，还有不少人掏出手机边跟边拍，海量人物角色各有各的行为。
视频无法播放显示，请关注微信公众号【程序视点】2月17日的文章，以下同理！
Sora

雨后东京街头，潮湿地面反射霓虹灯光影效果堪比RTX ON。

Sora

行驶中的列车窗外偶遇遮挡，车内人物倒影短暂出现非常惊艳。

Sora

也可以来一段好莱坞大片质感的电影预告片：

Sora

竖屏超近景视角下，这只蜥蜴细节拉满：

Sora

…
Game over!，工作可能要丢了！是不是需要给某些行业准备追悼词了？

AI理解运动中的物理世界

OpenAI表示，正在教AI理解和模拟运动中的物理世界，目标是训练模型来帮助人们解决需要现实世界交互的问题。

根据文本提示生成视频，仅仅是整个计划其中的一步。

Sora

目前Sora已经能生成具有多个角色、包含特定运动的复杂场景，不仅能理解用户在提示中提出的要求，还了解这些物体在物理世界中的存在方式。

比如一大群纸飞机在树林中飞过，Sora知道碰撞后会发生什么，并表现其中的光影变化。

一群纸飞机在茂密的丛林中翩翩起舞，在树林中穿梭，就像候鸟一样。

Sora还可以在单个视频中创建多个镜头，并依靠对语言的深入理解准确地解释提示词，保留角色和视觉风格。

美丽、白雪皑皑的东京熙熙攘攘。镜头穿过熙熙攘攘的城市街道，跟随几个人享受美丽的雪天并在附近的摊位购物。绚丽的樱花花瓣随着雪花随风飘扬。

对于Sora当前存在的弱点，OpenAI也不避讳，指出它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。

例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”，狼的数量会变化，一些凭空出现或消失。
Sora

该模型还可能混淆提示的空间细节，例如混淆左右，并且可能难以精确描述随着时间推移发生的事件，例如遵循特定的相机轨迹。如提示词“篮球穿过篮筐然后爆炸”中，篮球没有正确被篮筐阻挡。

技术方面，目前OpenAI透露的不多，简单介绍如下：

Sora是一种扩散模型，从噪声开始，能够一次生成整个视频或扩展视频的长度，关键之处在于一次生成多帧的预测，确保画面主体即使暂时离开视野也能保持不变。
与GPT模型类似，Sora使用了Transformer架构，有很强的扩展性。在数据方面，OpenAI将视频和图像表示为patch，类似于GPT中的token。通过这种统一的数据表示方式，可以在比以前更广泛的视觉数据上训练模型，涵盖不同的持续时间、分辨率和纵横比。

Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示词技术，为视觉训练数据生成高度描述性的标注，因此能够更忠实地遵循用户的文本指令。

除了能够仅根据文本指令生成视频之外，该模型还能够获取现有的静态图像并从中生成视频，准确地让图像内容动起来并关注小细节。

该模型还可以获取现有视频并对其进行扩展或填充缺失的帧，请参阅技术论文了解更多信息（说是今晚发布，大家可以期待）。

Sora 是能够理解和模拟现实世界的模型的基础，OpenAI相信这一功能将成为实现AGI的重要里程碑。

最后

目前已有一些视觉艺术家、设计师和电影制作人（以及OpenAI员工）获得了Sora访问权限。他们开始不断创造出新的作品。OpenAI CEO奥特曼也开始了在线接单模式: 你可以带上你的提示词@sama，就有可能收到生成好的视频回复。

更多精彩内容，请关注微信公众号【程序视点】2月17日的文章。

One more thing

以下内容是微信公众号【程序视点】读者小伙伴专享福利。这可能是你千载难逢的起飞机会，务必阅读！

AI技术在不断发展，能够创造出依托于AI的全新产品或者服务，就可以改变我们的生活方式和工作方式。

不仅如此，AI技术还会在医疗、金融、教育、交通、艺术、互联网等多个领域得到实际的应用，今天的”文生视频“就是一个好例子！

想想之前的外贸、房地产、软件…你错过了多少机会？

AI 时代已来，这是属于我们的时代！千万不要再错过了！

还在为重复的工作而困扰吗？还在为天花板太低的薪资所烦恼吗？还在担心被炒掉找不到工作吗？

🔥 和小二哥一起，我们一起抱团起飞 🔥

1、数不尽的优质 AI 教程和副业变现方法，和比拟市面上千课程的航海资料，赋能职场，早点下班！

2、数百位行业大咖，企业家资源共享，帮你建立强大的商业网络。说不能在这里能遇见你的伯乐！

3、成功案例的启示，孵化了众多优秀的前辈，他们给你背书，大佬就在身边，抄作业就可以了！

👉 立刻行动，关注微信公众号【程序视点】，回复：GPTs, 为你的主业加码，拓展无限商业可能。

别让未来的自己，后悔没早点选择！你想了解的内容，都可以找到对应的知识，比如AI提示词、AI小红书、AI公众号、AI数字人、AI大模型、职场办公技能、AI绘画及编程等多个AI热门领域。

不管你懂或者不懂，擅长或者不擅长，哪怕你是普通人、新人小白，只要肯行动总会有收获。

身为普通人，如果想要逆袭，最好的方式就是吃红利，不断地吃红利，毫无疑问，AI就是今天最大的红利，你准备好了吗？

关注

44
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
OpenAI推出生成式视频划时代的模型：Sora惊艳登场，引爆行业变革！这次，它又将颠覆哪些领域？

OpenAI发布首个视频生成模型Sora。完美继承DALL·E 3的画质和遵循指令能力，能生成长达1分钟的高清视频。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。