Runway正式发布全新Gen3模型，AI视频的王，它回来了

最新推荐文章于 2024-07-16 20:31:25 发布

程序猿李巡天

最新推荐文章于 2024-07-16 20:31:25 发布

阅读量1.7k

点赞数 32

文章标签：人工智能爬虫大数据机器学习深度学习

本文链接：https://blog.csdn.net/m0_59235945/article/details/139782341

版权

在AI视频被一众新秀，比如Sora、Luma、可灵等等占据注意力的时候，已经有人忘了AI视频领域统治了N久的王者，他叫Runway。

去年的11月份更新了一次Gen2模型模型，然后宣布他们要开始组团队开始进军世界模型之后。

他们就再无动静了。

在这里插入图片描述

一晃眼，将近8个月的时间。

Sora、Vidu、LTX、Luma、可灵轮番炸场。Runway依然不为所动，甚至都有好事者，做了一张梗图。

沉入海底的墓碑。

但是今天，那个AI视频领域的王者。

他终于回来了。

在悄无声息之间，他正式发布了它的Gen3模型。

https://runwayml.com/blog/introducing-gen-3-alpha/

话不多说，先放几个Gen3的Case。

我真的一声长叹，你要说这AI时代，是谁拉开了AI视频的长河，那自始至终，也只有一个名字。

Runway。

2022年8月，跟Stability AI一起训了一个举世闻名的模型，叫Stable Diffusion。

2023年2月发布Gen1，支持视频风格转绘。

2023年6月发布Gen2，开启了文生视频和图生视频的序章。

2024年6月，整整一年的时间，带着世界模型的Gen3，终于TM的来了！！！

我的心情真的感慨万分，去年Gen2刚刚上线时，我为了展示AI视频的能力，做了《流浪地球3》的预告片，而这个片子，也一举让国内的所有影视人，看到了AI视频的魅力。

而后11月Gen2模型更新，光影质感更稳定，我又做了《三体》；2月为了参加Runway的Gen48比赛，我又做了《TheLastGoodbye》。

可以说，我命运的齿轮，也一直是跟runway一起做着数不清的纠缠。

而今天，Runway的Gen3终于发布了，虽然是Alpha版本。

但也证明了，王，他一直都在。

我把所有的官方发的片子都看了一遍，大概总结了几个点：

1.极度稳定的光影

看官方的这个Case。

Prompt：在日本城市以超高速移动的火车窗户上，一个女人的微妙倒影。

夜景的灯光，绝对是AI视频里面最难搞的之一，更别提在高速火车上极速变换的夜景灯光，但是Gen3跑出来的这个效果，不说完美，但是依然变化极其丰富，且稳定的非常可怕。

2.10s长度

可以看到，Gen3所有的case都是10s钟的。

而且大概率，Gen3开放给大家用的时候，大家生成的时长也是10s。

最重要的是，根据他们老板Cristobal Valenzuela说，Gen3的模型生成速度还非常快。

5s的视频生成时间45s，10s的视频生成时间90s。

基本秒杀现在市面上所有第二代AI视频的生成速度了。毕竟动不动几分钟一个，这个时间还是挺难顶的。

3.审美强

之前很多的AI视频产品，审美就是一坨。真的。。。实在是太丑了。

还有总是给自己乱加戏的，关键加的还是巨丑的戏。用起来神烦，说的就是那个Luma。

反观Runway，一直以来的特点就是审美强，毕竟正儿八经做影视起家的，还去做了《瞬息全宇宙》的特效，比外行强多了。

比如这两个。

Prompt：博物馆里一幅画的广角对称镜头。摄像机缩进到靠近画面。

Prompt：一个隐身人物在高楼大厦之间升空的航拍视角。

这配色和风格，喜欢，是真喜欢。

4.想象力看着靠谱

很多模型都是做真实世界的效果很强，但是一旦到了一些幻想、玄幻、科幻、魔幻的画面上，就直接废了。就感觉跟过拟合了一样。

Runway Gen3的这个看着很强，但是实际不好说，因为还得实际上手测。不过我自己，对Runway还是非常有信心的。

比如：

Prompt:在夜晚的破旧城市里，透过窗户看到一个巨大奇怪的生物在行走，只有一盏街灯微弱地照亮了周围。

Prompt：通过一个有闪烁灯光的走廊进行超级延时摄影，一块银色的布料飞过整个走廊。

5.物理规律

物理规律简直已经是第二代AI视频的标配了。Runway Gen3的物理规律看着也非常的棒。基本上是行业第一梯队水平。

Prompt：一位年长男士在侧面受光的钢琴上演奏。

整体，我很喜欢。

在官方文档里，Runway对Gen3 alpha的描述是这样的：

“Gen-3 Alpha is the first of an upcoming series of models trained by Runway on a new infrastructure built for large-scale multimodal training. It is a major improvement in fidelity, consistency, and motion over Gen-2, and a step towards building General World Models.”

“Gen-3 Alpha 是 Runway 在为大规模多模态训练构建的新基础设施上训练的即将推出的一系列模型中的第一个。与 Gen-2 相比，它在保真度、一致性和动作方面有了重大改进，是朝着构建通用世界模型迈出的一步。”

但是世界模型，不是最重要的，因为大家已经看过Sora、可灵啥的了。

最重要的是这句话。

“现有的控制模式包括 Motion Brush、高级摄像头控制、导演模式以及即将推出的工具，用于更精细地控制结构、风格和动作。”

我跟很多的AI创作者有过很多的交流，大家有一个观点出奇的统一，那就是：Luma和可灵是玩具。

因为可控性。

一个完整的AI视频作品，要的除了物理规律，还要超强的可控性，要不然就会像气球人的导演控诉Sora一样，Roll特么300个镜头才有1个能用的。

而Luma和可灵，都只有文生视频和图生视频这两种模式，甚至可灵的图生视频都还没上线。

不够，这远远不够。

而Runway在2018年成立的那一天，他们的目标，就是颠覆电影行业。

所以他们清楚，可控性这玩意，太重要了。

所以他们做了相机运动，做了运动笔刷，做了人物扣除，做了各种各样的有趣的工具。

这一切，都是为了创作者们，能做出更可控的画面。而我到了如今，用的最多的AI视频工具，也还依然是Runway。

现在，Runway的Gen3，直接带着那全套的工具，回来了。

未来几天内，就会开放给所有人。

在这里插入图片描述

以Runway的Gen3 Alpha推出的今天为信号。

我觉得，AI视频正式进入了2.0时代。

嗯，那个全面冲击的时代。

迎接变革。

也迎接，王的归来吧。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

程序猿李巡天

关注

32
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
Runway正式发布全新Gen3模型，AI视频的王，它回来了

在AI视频被一众新秀，比如Sora、Luma、可灵等等占据注意力的时候，已经有人忘了AI视频领域统治了N久的王者，他叫Runway。去年的11月份更新了一次Gen2模型模型，然后宣布他们要开始组团队开始进军世界模型之后。他们就再无动静了。一晃眼，将近8个月的时间。Sora、Vidu、LTX、Luma、可灵轮番炸场。Runway依然不为所动，甚至都有好事者，做了一张梗图。沉入海底的墓碑。但是今天，那个AI视频领域的王者。他终于回来了。在悄无声息之间，他正式发布了它的Gen3模型。
复制链接

扫一扫