人人都是导演的时代很快就要来临了!
截至目前为止,OpenAI
的又一次展示了AI模型的技术力量,本次openAI又发布了颠覆整个影视界的Sora模型,将视频生成技术门槛上玩出了相当高的AI花活儿。
不难想象,世界发生着难以想象的变化。看似很远,但又瞬间近在眼前!
Sora是什么?
Sora是OpenAI发布的一个文生视频模型,可以根据文字描述来生成现实世界视频内容。它能够根据用户输入的文本描述,生成长达一分钟的高质量视频,这些视频不仅视觉质量高,而且与用户的文本提示高度一致。
Sora的核心功能是文本到视频(Text-to-Video)生成,即根据用户提供的文本描述,生成对应的视频内容。这项任务要求模型理解文本语义,并将其转换为视觉表达,具有广泛的创作和应用价值,可用于内容制作、教育和娱乐领域。
Sora的几个特点
1.60s超长长度
Sora 生成视频长度能达到分钟级别,的确令人感到震撼。之前就大火的RunWay、Pika 以及 Stability 的 SAD 等他们生产的视频最长不过十几秒。
2.超强语义理解
根据OpenAi 模型分析文字中的各种细节,包括人物的动作、表情、对话等,并能够将这些信息转化为视频内容。
3.多镜头切换
OpenAI直接一句Prompt,在一分钟的镜头里,实现了多角度的镜头切换而且物体一致。
4.更丰富的视觉细节
Sora生成的视频视觉细节丰富,物体纹理清晰,色彩逼真,整体视频质量更高。相比之下,其他模型生成的视频通常显得模糊、细节不足、色彩不那么鲜艳。
例如,在生成的“女人眨眼睛”的视频中,Sora对女性眼部的特写十分到位,从眉毛、睫毛、眼皮褶皱、眼袋、卧蚕和细纹的细节来看,已经达到以假乱真的效果。这么厉害的Sora,对影视行业、短视频行业、新闻传播行业、广告营销行业都带来了巨大的影响,而且是好是坏目前还没有人能确切地说清楚,我们能知道的就是,未来以来,唯有应对。
Sora模型的工作原理
Sora模型基于扩散型变换器(diffusion transformer)架构,这是一种深度学习模型,能够将随机噪声逐渐转化为有意义的图像或视频内容。
Sora通过视频压缩网络将输入的图片或视频压缩成低维度表示形式,并通过空间时间补丁将其分解为基本构建,并且使用大语言模型的方法理解视频,实现了对物理世界的“涌现”。这种方法使得模型能够根据描述性的文本提示或静态图像,生成长达1分钟的视频,视频中还包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。
比如提示词:一只小熊猫和一只巨嘴鸟是最好的朋友,在蓝色时刻漫步在圣托里尼岛
##yh174EmTstI/gUjgRtTG0DweFR7Ts54JJdgC0IqL/q98eK/6Kx8F1tN0ud6vgiYf##
Sora通过训练,学会了理解和处理文本提示,将用户的描述转化为视频内容。它不仅能够生成具有连贯性的场景和运动的镜头,还能够模拟复杂的场景和角色表情,为视频增添更多细节和想象力。
Sora最终可以应用在哪些行业?
没有演员的影视作品出现,对演员来说是个小挑战,将出现真正的“虚拟偶像”,此前的二次元人物并没有真正达到“偶像”的级别,Sora对于广告业、电影预告片和短视频行业将产生巨大的颠覆!
第一个是传统影视行业
现在的影视行业,需要不停协调各个工种,从舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务到动画特效,可以说一个环节掉链子,现在都可以用AI去完成了!
第二个是广告行业
现在的汽车广告,需要在一些崇山峻岭甚至在沙漠里,陡峭的山坡上进行形式,传统广告公司报价基本在百万级别,有了Sora可以很快的生成这里的视频,并且可以节约不少的开支,当然,不仅仅是汽车广告,还有美食广告、很多高档酒店的介绍、旅游景点的推荐视频,这种并不需要复杂情节的广告作品,都会受到剧烈冲击。
其他行业:
- 短视频行业
- 教育
- UI设计
- 游戏开发
- 元宇宙时代
Sora带来的影响
1、短视频流行开以后,视频剪辑师也随之成为一个热门职业。如果视频剪辑的工作可以用AI来代替,可能会有很多视频剪辑师失业。
2、利好编剧行业,剧本、文本创作力成为核心竞争力。
普通人该咋办?
此次AI大爆发,直击打工人的软肋。毕竟降本增效成了企业宗旨,而我们是那个‘本’,AI是‘增效’。
未来已来,站在人工智能时代的门槛上,我们有必要深化对AI技术内核的理解,与时俱进才是符合当下的潮流!