Sora视频大模型：是媒体行业的机遇还是挑战？_

最新推荐文章于 2024-07-21 10:42:24 发布

Cc不爱吃洋葱

最新推荐文章于 2024-07-21 10:42:24 发布

阅读量476

点赞数 20

文章标签：音视频媒体人工智能大语言模型自然语言处理 AI大模型大模型

本文链接：https://blog.csdn.net/2401_85328934/article/details/140488745

版权

Sora一夜之间刷屏。

作为OpenAI发布的首个AI文（图）生视频模型，Sora带给人们的感受是炸裂级的——根据输入的文字提示，能生成效果逼真的60秒视频，而且是可以一镜到底那种。

这意味着，继文本、图像之后，OpenAI将其先进的AI技术拓展到了视频领域。

虽然Sora模型尚未面向公众开放，但是已经有人感叹：视频生产颠覆性革命来了……

也有人预测：一大批视频从业人员要失业了……

然而，事情就这么简单吗？

1、 Sora能做什么？

OpenAI在官网陆续公布了几十段长短不一的视频，均根据文字提示生成。

其中第一段视频的文字提示为：

一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。

Sora根据提示生成的一分钟视频如下：

这一分钟视频在网上广为流传，可以视为Sora的代表作。其展示的信息量极大，从主要人物到背景人物、远处的街景以及地面，看起来十分逼真，镜头切换也非常流畅自然。

【一一AGI大模型学习所有资源获取处一一】

①人工智能/大模型学习路线

②AI产品经理入门指南

③大模型方向必读书籍PDF版

④超详细海量大模型实战项目

⑤LLM大模型系统学习教程

⑥640套-AI大模型报告合集

⑦从0-1入门大模型教程视频

⑧AGI大模型技术公开课名额

从这张全景画面截图可以看到，和主人公同时走动的路人、湿漉漉的地面、眼花缭乱的霓虹灯和招牌。

再看后面几个特写镜头：女主脸上斑点、脖纹清晰可见，显得非常真实，还有墨镜里的反射的街景，这些细节都没放过。

官网还展示了一条电影预告片，文字提示为：

电影预告片，讲述了 30 岁的太空人戴着红色羊毛针织摩托车头盔的冒险经历，蓝天，盐沙漠，电影风格，用 35 毫米胶片拍摄，色彩鲜艳。

Sora根据提示生成的视频如下：

我们再来看看Sora生成的其他作品。

中国龙年舞龙的视频：

穿过东京郊区的火车窗外的倒影：

赛博朋克背景下机器人的生活故事：

几只巨大的毛茸茸的猛犸象正踏着白雪皑皑的草地走来：

随着Sora发布更多的制作精美的作品，不少人感叹：人类都未必拍得出来！

马斯克在X上两次转发网友评论时写道：“AI增强的人类将创造出最好的作品。”“人类认赌服输。”

2、 Sora牛在什么地方？

这些看上去足可以假乱真的视频，Sora是怎么做到的？

根据OpenAI官方介绍，用户可以通过使用自然语言提示词（Prompt），生成长达1分钟的视频。

Sora模型对语言有深刻的理解，因而能够准确地理解提示词，并生成令人信服的人物，而且可以在一个生成的视频中创建多个镜头，在这些镜头中准确地保持角色和视觉风格的一致性。

360创始人周鸿祎对Sora给予了极高的评价，他在社交平台发文：Sora的诞生意味着AGI（通用人工智能）实现可能从10年缩短至一两年。

在他看来，Sora只是小试牛刀，它展现的不仅仅是视频制作能力，而是大模型对真实世界有了理解和模拟之后，可能会带来的新的成果和突破。他认为，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。

中央民族大学新闻与传播学院教授郭全中在接受新京报传媒研究采访时说，相比ChatGPT，Sora有了质的飞跃：

一是Sora具备推理能力，人类长期以来孜孜以求的AGI（通用人工智能）成为可能，估计不久之后就会到来，而ChatGPT只是让我们看到了曙光。

二是在当今视频时代，Sora作为图生视频的利器将助力传媒业降本增效，极大地扩大能力范围和能力边界，给传媒业带来的影响远远超过ChatGPT。

DCCI互联网研究院院长刘兴亮在接受新京报贝壳财经记者采访时表示，Sora模型的发布标志着AI技术在内容创作领域的一个新纪元，“通过简短的文本提示或一张静态图片，Sora能够生成持续一分钟左右的1080P高清视频，涵盖多个角色、不同类型的动作和背景细节等，几乎达到了电影级别的逼真场景。”

他认为，这种能力不仅为内容创作者提供了前所未有的工具，使他们能够以更低的成本和更快的速度将创意变为现实，而且为观众带来了更丰富和多样化的视觉体验。技术创新的这一巨大飞跃，预示着AI在未来人类生活的各个方面都将发挥更加重要的作用。

中国人民大学吴玉章讲席教授、国家发展与战略研究院研究员刘永谋在新京报评论撰文认为，Sora的AI视频效果几乎和人工拍摄不相上下。也因此，虽不是从0到1的原始创新，却已足够令人震惊。

他预测，未来，各种不同用途的Sora短视频或许会很快充斥各种视频社交平台，其对现实的影响与改变，不可不谓之巨大。

从业界到学界，几乎是异口同声认为，Sora将会深度改变视频相关领域，从影视、传媒到社交平台，内容生产将会发生巨变。

3、Sora带来的两大挑战

当然，Sora并非完美，毕竟才刚刚诞生。

OpenAI在官网表示，目前Sora模型也有弱点：

它可能难以准确模拟复杂场景的物理特性，并且可能无法理解因果关系的具体实例。例如，一个人可能会咬一口饼干，但之后，饼干可能没有咬痕。

同时，该模型还可能混淆提示的空间细节，例如，左右混淆，并且可能难以精确描述随时间推移发生的事件，例如遵循特定的相机轨迹。

比如在一个样片中，提示词为“考古学家在沙漠中发现了一把普通的塑料椅子，正小心翼翼地挖掘和除尘”，Sora生成的视频出现了椅子变形、自动行走等诡异的场景。

另外，OpenAI还需要花更多精力检查、拦截违反使用政策的文本输入提示，例如极端暴力、色情内容、名人肖像等。

对于传媒从业者来说，则有两大挑战值得思考——

一是对视频内容生产的颠覆，或导致大量人员失业；

二是对新闻传播伦理的挑战，模糊了真实与虚拟的边界。

又有一批人要失业？

刘永谋认为，当前的短视频时代，Sora既然可与人工媲美，制造短视频的专门团队可能就面临下岗危险。要知道，短视频的摄影、导演、剪辑等任务，Sora“一个人”费点电就全包了。

“这可能导致大量的影视等相关行业从业者失业，更是不可忽视的重大社会风险。”

刘永谋在文中提醒，关于AI大规模应用可能引发的失业问题，已经有汗牛充栋的深入研究，也提出了很多应对方案，包括延缓AI技术的应用速度，帮助再就业，征收AI税等。

“现在，Sora一夜刷屏提醒我们，要将这些措施稳步细化实施，而不能再仅仅停留在刷屏上了。”

对于可能导致的部分人员失业，中央民族大学新闻与传播学院教授郭全中在接受新京报传媒研究采访时说：任何创新事物出现，肯定会带来结构性失业，即不能适应创新的人要失业。但是，创新事物也会带来大量新就业机会，关键是看自己能否通过自我提升，与新事物共生共成长。

新闻传播伦理再面临挑战

真实是新闻的生命，但随着更多高科技的出现，很多人模糊了真实与虚假的界限。

刘永谋认为，在AI短视频建构的世界中，显然不能将眼睛看到的东西作为判断依据了。Sora的应用，无疑将进一步加剧当代社会的后真相状况，真实与虚拟的边界进一步模糊，甚至完全被消解，“这需要我们高度警惕”。

“不管Sora是否’理解’世界，也不管Sora视频多么逼真，始终仍是数字模拟，而不是真实拍摄的现实。”

郭全中也认为，Sora的出现，会导致视频生产门槛大大降底，新闻伦理肯定会受到很大冲击。

他说，Sora不但会大规模应用于娱乐内容的生产和传播，同样也必然会给新闻生产带来巨大挑战，我们之前的新闻生产方式和流程会被颠覆，新闻的定义也会发生变化，如大量的技术手段应用等。

从新闻传播发展来看，图文时代，都说“有图有真相”，结果发现图可以P；再到视频时代，又有人说“有视频有真相”，结果现在视频也可以AI生成。

郭全中预计，Sora未来更重大的挑战在于会导致假新闻的泛滥，给新闻伦理和新闻治理带来巨大挑战。

此外，刘兴亮还认为，“随着AI生成内容与现实之间的界限变得越来越模糊，如何确保内容的真实性和透明性成为了一个重要问题。此外，版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战，通过制定相关政策、法律和伦理准则来确保技术的健康发展，同时保护个人和社会的利益不受侵害。”

科技尤其是人工智能，还会以什么样的速度改变传媒行业和人类？身处其中，我们既有期待，也有些许忐忑。

AI时代的职场新潮流

听说AI要来抢工作了？别担心，新岗位可比旧岗位有趣多了！想象一下，你从搬砖工升级成了机器人操作员，从算盘小能手变成了大数据分析师，这不是美滋滋吗？所以，社会生产效率提升了，我们也能更轻松地工作。不过，想成为AI界的佼佼者？那就得赶紧学起来，不然就会被同行们甩得连AI的尾巴都摸不着了！

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

Cc不爱吃洋葱

关注

20
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Sora视频大模型：是媒体行业的机遇还是挑战？_

DCCI互联网研究院院长刘兴亮在接受新京报贝壳财经记者采访时表示，Sora模型的发布标志着AI技术在内容创作领域的一个新纪元，“通过简短的文本提示或一张静态图片，Sora能够生成持续一分钟左右的1080P高清视频，涵盖多个角色、不同类型的动作和背景细节等，几乎达到了电影级别的逼真场景。他认为，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。刘永谋在文中提醒，关于AI大规模应用可能引发的失业问题，已经有汗牛充栋的深入研究，也提出了很多应对方案，包括延缓AI技术的应用速度，帮助再就业，征收AI税等。
复制链接

扫一扫