卷!Gen-2重磅发布,一句话一张图,3秒让视频无中生有!

Runway推出了视频生成模型Gen-2,能根据文本、图像或现有视频创建新的视频内容。用户可以使用简单的指令或图片,创造出各种风格的视频,包括动画、写实等。尽管目前画质有待提升,但这一技术标志着AI在视频生成领域的重大进步,对电影制作行业可能产生深远影响。
摘要由CSDN通过智能技术生成

b0d5eb27459146198a92e2fa5725631f.png

编|Aeneas 好困
源|新智元

Runway的Gen-1还没内测完,Gen-2就以迅雷不及掩耳之势发布了。这次的效果更加炸裂,AI大导离淘汰人类,又近了一步。

昨天,Midjourney生成的完美情侣刷爆网络,大家纷纷在留言区里畅想,下一步,就是演员被淘汰,人人都能升级大导,一键生成大电影了。

巧得很,今天,会做视频的AI模型不就来了嘛。

刚刚,仿佛一声惊雷炸响,Runway发布了文字生成视频模型Gen-2。宣传词也是非常炸裂——「say it,see it」,只要你说得出来,它就能给你做出来。科幻小说里的超能力成真了!

可以说,有了Runway Gen-2,你就能用任意的图像、视频或文本,生成一段酷炫大片,想要啥风格,就有啥风格。

5c35e47f0db97db3fd197764da9cde25.gif

这个速度简直让人目瞪口呆:Gen-1的内测都还没拿到呢,Gen-2就来了!

27423543c2272867b6886792443189da.png

一句话,一张图,三秒视频无中生有

此前,Runway在文本到图像领域就曾经大放异彩,大名鼎鼎的Stable Diffusion,就是Runway开发的。

在今年2月,Runway就提出了首个AI编辑模型Gen-1。

顾名思义,Gen-1可以在原视频的基础上,编辑出咱们想要的视频。无论是粗糙的3D动画,还是用手机拍出来的摇摇晃晃的视频,Gen-1都可以升级出一个不可思议的效果。

9c9c5a514b5198e0cd715b119d76e4b0.png

论文地址:
https://arxiv.org/abs/2302.03011

比如用几个包装盒,Gen-1就可以生成一个工厂的视频,化腐朽为神奇,就是这么简单。

23654419cd38f785e6e467d0be9d69a3.gif

而相比Gen-1,Gen-2获得了史诗级的升级——可以从头开始生成视频。

ae172ab858dd79edbf45824f5f8374c7.png

目前,这个模型还未开放,预计在几周内会公开。

而根据目前的演示片段看来,Gen-2的效果似乎暂时比不上Gen-1,没有那么逼真。

但是,这毕竟是AI文生视频0到1的第一步。AI导演做到这一步,已经够人类颤抖的了。

97f0b52c10e7048ed93203426ad68b6d.png

网友实测,效果炸裂

而获得内测资格的幸运网友,已经开始动手生成自己的电影了。

可以看出,无论是宫崎骏风格的日系动画,还是写实风格的镜头特写,或者魔幻特效的电影大片,Gen-2都不在话下。

3daf3a3b4cb3e6cd40496d3ea381c07d.gif

fe3e474de6b63838768dfecc33409764.gif

93e3d5a328e7ab6b6d4d56dd9d075b4c.gif

01657c6c99570c8c7af01c5810daee58.gif

虽然目前的画质可能还不够细腻,但毕竟是从0生成的视频,一旦日后优化好,大导们的饭碗怕是捧不稳了。

Gen-2的八大「魔法」

Mode 01:Text to Video(文字生成视频)

一个文本提示,就能合成出任意风格的视频,不怕它生不出来,只怕你想不到。

提示:

在纽约市的一间阁楼里,傍晚的阳光透过窗户温柔地洒进屋内。

输出:

bec4aa264e18fc2ca02307fcb62991eb.gif

Mode 02:Text + Image to Video(文字+图像生成视频)

输入一幅图,再加一句prompt,直接就给你变成了视频。

输入图像:

a4ac405fddf3f7551e4cca4c692b12e0.png

驱动提示:

在一个低角度拍摄的画面中,男子正沿着街道行走,周围酒吧的霓虹灯照亮了他的身影。

输出:

01e684ae36869d487c1c6bfa782db46d.gif

Mode 03:Image to Video(图像生成视频)

这个不用解释了,你给它一张图片,它给你秒变一段视频。多种风格,随你选择。

美图一秒变电影,这也太梦幻了吧。

输入图像:

7e0c038078851e8a017c60f0aef73e69.png

输出:

aadbdf1bfad4e0173d8875c59d827ccd.gif

Mode 04:Stylization(风格化)

如果你有一段原视频,但是效果不够炸裂,怎么办?

只需要把你想要叠加的风格用图片或者文字叠加上去,多魔幻的风格都立马生成,秒变好莱坞大片。

原始视频:

5fed7b5f5b01eed99b6843aecfd86eaf.gif 

驱动图像:

f2efe439120fa0267cef6e1d79aabbcb.png

输出:

a59d05e02dbcf98581d3f1ed05438162.gif

Mode 05:Storyboard(故事版)

将模拟的场景一拉,就变成了风格化和动画化的渲染图,前期制作一键简化。

输出&输出对比:

2b18cadfbb1cdf85bdcc0ee9c1fe0ae9.gif

Mode 06:Mask(掩码)

在你的视频中分离出特定的对象,然后通过prompt,想怎么改就怎么改,比如下图中,金毛秒变斑点狗。

输入视频:

7409ab9f633892a2109aedf5d2fcc3c6.gif

驱动提示:

一只身上有黑色斑点的白毛狗。

输出:

2884311a6de2368f3388b02b0e57437f.gif

Mode 07:Render(渲染)

只要输入图像或提示,无纹理的渲染立马变成现实的输出,深度和真实感震撼人心。

输入视频:

5ac4d64dd8d620736efbc0874cc3c73b.gif

输出:

5048a02a838bc3585bd0ff06a7408b48.gif

Mode 08:Customization(个性化)

通过自定义,让原视频个性化大变身,保真度还超高。

点击就看外国小哥秒变海龟人。

输入&输出对比:

0110cf3afe8a0f1ccb276645a7c5da3b.gif

训练图像:

e8cd4f9911dcf6601f42b31475a998c4.png 0d48ae3f8f691e47fe68b7c0b5f9a402.png

从生成结果来看,Gen-2的前景,实在是太令人着迷了。(Gen-1的内测申请在这里,http://t.cn/A6Cu1cdy)。

虽然Meta和谷歌也有类似的文本到视频模型(Make-a-Video和Phenaki),生成的剪辑更长、更连贯。

但这些体量更大的公司并没有投入多大的资源,相比之下,Runway的团队只有区区45人。

其实,Runway自2018年以来,就一直专注于研究AI工具,并在去年年底筹集了5000万美元。

有趣的是,Stable Diffusion的初始版本,就有Runway的贡献。只不过后来被Stability AI普及,并有了更进一步的发展。

而这也告诉我们,初创公司在生成式AI上的潜力,是多么惊人。

一大波展示

34c308d4120b6f76988162c597ef3ae1.gif
▲提示:一只眼睛的特写镜头
beb8e73fa9f627130098fe0fa20a0525.gif
▲提示:无人机拍摄的沙漠景观
8b050596a09df2fc4a6e2012f434ef57.gif c6e02321715b00ba0701f0e4071dc216.gif 070729c04909153536c805f7407a65cf.gif 89c8c716d392b78c9a1934c3b08e32b2.gif 650970bff26ce29d8c91f3c729e58257.gif 283c66c20532d4bda391cda8aee1fcd9.gif 65911c076a2ffde9e594cd45f5f59ed7.gif 177f83feb783ac63a3d52430a14e120e.gif d8cfbe6d435a8108aa5e367872f799e0.gif 2cc8b516d172f632c711674345ca09a7.gif 293b9852635244c44976dc781327130e.gif


a94db1f3025449e09ae36b2caef4784c.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 b2805acb455fd6dc527c1bada7a524bd.png

[1]https://research.runwayml.com/gen2
[2]https://www.theverge.com/2023/3/20/23648113/text-to-video-generative-ai-runway-ml-gen-2-model-access
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值