最全最新的Sora解读来了 它凭什么刷爆科技圈?

60e381646b870babee620af42a6b4f9c.png

Sora有多火

看看这两天的全球科技媒体头条

作为首个文生视频模型
Sora一经问世

将文本转化为视频的超强功能
使其迅速霸屏科技圈


它是否代表着AI大模型的未来走向
会砸了谁的饭碗
跟普罗大众又有什么关系
国内大厂还有机会吗
……
今天,我们就来揭秘种种疑问

帮助大家快速、深入地了解Sora

01

Sora是什么?

Sora是OpenAI发布的首个AI视频生成模型,在视觉领域实现了与大语言模型类似的突破。

它能够根据用户提供的文本信息,生成长达1分钟的1080p复杂场景视频,且视频细节逼真、人物和景色连贯。即便是大中景无缝切换、人物特写等,也能保持高质量、连贯性。

4d685894dfcceac0b0c834d8d0346816.gif

02

区别于传统智能视频生成,Sora惊艳在哪里?

在对语义理解、视频运动轨迹速率、复杂视觉连贯呈现等方面,Sora一骑绝尘,能够模拟物理世界中的人、动物和环境的局部特征,可以说重新定义了AI视频生成模型的标准。

60秒超长时长:传统智能视频生成,多局限在5至15秒的连贯性,而Sora将这一时长提升到60秒,并且场景切换、特写等均满足文本需求。还支持视频到视频的编辑,拼接完全不同的视频使之合二为一、前后连贯。

单视频多角度镜头:在广告、影视剧等拍摄中,同一场景需要多个机位拍摄,呈现出多镜头效果。Sora突破AI视频单镜头限制,可以生成多个镜头,且各个镜头具有角色和视觉风格的一致性。

读懂世界的模型:Sora是扩散+Transformer的视觉大模型,并且产生了涌现现象。通俗来讲,它通过收集、清洗数据对现实世界有更深刻的理解、互动和模拟能力,生成的视频更加逼真。

e82e83abdc9cde73c1bfcbf59f227fd6.gif

03

Sora对AI行业有怎样的推动力?

Sora的问世引爆科技圈,360创始人周鸿祎称,其的诞生意味着AGI的实现可能从10年缩短至两年左右。“有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具。”

95f1d2408ebd102defae13f437e9325b.jpeg

毫无疑问,Sora这类文生视频大模型的出现无疑将会推动AI基础设施的需求猛增。业内消息,OpenAI、软银、英伟达等巨头公司都被曝正在进行AI芯片的制造布局。而面对这么大的赛道、机会,国内大厂肯定还有各种想法。

04

哪些行业有可能被颠覆?

从目前Sora展现的能力来看,它对内容创作、广告娱乐和影视制作行业的冲击是首当其冲的。它让非专业人员,都有可能成为短视频创作者,这势必会产生新业态。

但对于带有剧情的长篇故事视频,除了多镜头、连贯性等要求,还需要创新场景、准确和具有节奏的叙事、镜头语言等等。换句话说,大导演之所以能成为大导演,不光是技术过硬,还得有独特的拍摄手法、叙事风格。从这一点来看,短时间内Sora不可能彻底替代人或者说让专业人员失业,反倒有可能让影视人创造出更多元丰富的作品。

05

国内还赶得上吗?

可能性很小。

从2023年的ChatGPT就能看出来,国内AI创新能力不足,始终在“跟随”。虽然后来也出现了百模大战,但没有做到“引领”。

而且,技术上的限制也注定我们很难后来居上。无论是文本大模型还是文生视频大模型,底层逻辑是对海量数据的训练与计算,这就又回到了我们的短板——芯片。如果芯片上没有大突破,大模型就“大”不起来。

可见,留给国内厂商的时间确实不多了。

06

普通人能用Sora干点啥?

能干的不少。

比如,可以卖Sora邀请码,跟ChatGPT一样,如果Sora采取邀请制或账号有限制的方式,那么售卖账号或邀请码就成为了商机。比如售卖高质量的视频生成prompt。再比如,使用Sora生成的视频运营自媒体账号。还可以制作Sora相关的使用教程做知识付费等等。

一句话,只要Sora用得好,普通人也能享受到技术红利。

07

Sora模型在未来社会中的挑战是什么?

Sora的出现让我们看到了AI技术的颠覆式发展。但也别高兴得太早,还有不少问题待解决。

首先,Sora不是万能的,它难以准确模拟复杂场景的物理特性,无法理解因果关系的具体实例。例如,一个人咬了一口饼干,但饼干可能没有咬痕。同时,该模型还可能混淆提示的空间细节,例如,左右混淆。

当然,上述技术上的问题还是比较好解决的。Sora模型在隐私保护、数据安全、算法偏见等挑战更大。

一,对抗性攻击,Sora存在算法被欺骗攻击风险以及AI数据投毒攻击风险,也就是说Sora容易生成错误的误导性结果,引起认知混淆,比如身份伪造,涉黄涉暴等不良信息。

二,隐私数据泄露,用户在使用Sora时,可能不自觉地输入个人隐私数据,甚至无意识地泄露商业秘密。

三,模型泄露的风险也是存在的,攻击者通过分析AI模型输出的结果,推断出模型的内部结构和参数,从而破解模型。生成逼真的假数据就很典型。

四,出现偏见和不公平,模型可能对不同政治信仰、国家、种族、团体进行有失公平的区别对待。

所以说,Sora未来的挑战不只是技术本身,还有很多“周边”要兼顾。

08

未来Sora如何发展?

Sora前途是光明的,道路是曲折的。

比如,Sora会朝着更复杂、更微妙的AI生成内容前进,并将伦理影响考虑在内。届时,我们能够将文本指令转换为生动、逼真的视频场景,一个充满创意和交流的新时代到来。

再比如,模型泛化能力会增强。现在,Sora主要依赖于大量的训练数据来生成视频内容。但实际应用中,用户可能会提出一些与训练数据不符的指令或需求。因此,未来需要提高Sora的模型泛化能力,更好地适应各种复杂的指令和需求。

整体来说,Sora未来会朝着通用世界模型的方向发展,能更好地理解现实世界。

1b6d86fa99c1cc61518fe1ad74992225.png

过年期间

Sora搅动了AI的“一江春水”

谷歌推出Gemini新版本

支持超过100万个Token的输入窗口
英伟达推出ChatWithRTX
要为每个人的电脑装上私有大模型
三个大事件让人类站在AI新时代的边缘
但国内没跟上


现在年已过
大厂们该行动起来了
哪家会先打样呢
是H,还是T,还是B......
中国版Sora会出现吗

欢迎评论区留言

31a6079dc06d44687ac9bcc28da7f88f.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值