二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持

奇月 发自 凹非寺
量子位 | 公众号 QbitAI

MinMax海螺AI新模型,让2D角色动起来了!

aa82ce7f55b72675a3f82e1b057d0b98.png

日漫游戏插画等各种风格的静态人物,都可以丝滑地转变成生动的2D风格视频。

量子位也马上上手实测了一波——

首先请出今年的顶流悟空先生,输入下面的prompt(输入时是英文,此处意译):

悟空在波涛汹涌的海面上准备战斗,金箍棒闪着金光,衣摆随风被吹动,气氛紧张

c9302928d39c0141b043488515e937ca.jpeg

来看看海螺的生成效果:

ca69df9c2bc94a75088859bf6fb51d8a.gif

不得不说,还真有大片里面战斗即将开场的即视感了!

随后,我们以经典动漫《你的名字》的海报为例,输入了以下prompt:

男孩和女孩转过身面对对方,表情很触动,眼中含有泪水,逐渐靠近并最终拥抱在一起。

1941e0ecea6c68ed3208de065fb17204.jpeg

最终的生成效果真的很赞。

连人物动作的一些停顿感都把握到了。还有AI最不擅长的头发问题,视频中的效果也没有太多违和感。

outside_default.png

最后再来一个抽象的(doge):

鸣人向哆啦A梦索要草帽,一个女孩拿着草帽和哆啦A梦一起出场,然后柯南在一边思考。

输入图像:

eb23371c32a1b1e40d164baf6a6395c3.png

来看看海螺的生成效果。

视频中把鸣人哆啦A梦草帽这几个要素都自然地组合在了一起,不过因为prompt中柯南用的是conan这个说法,它还没能完全理解。视频整体还是非常自然的,可以看到一些衣摆和头发的运动都很生动。

bcc90f5b7af626a2930a0ed2a50f9b07.gif

Hailuo I2V-01-Live是海螺Image-To-Video系列的最新模型,在生成画面的流畅性和动作的生动连贯性上有很大提升。

它主要针对稳定性细微表达进行了优化,还支持非常丰富的美术风格,可以生成更流畅和精致的作品。

更多网友作品

网友们见状自然是按捺不住,马上创作了很多作品。

6cb8aeb44a33b6496b5a642360276e81.png

比如最近超火的《双城之战》中的Jinx举牌:

d68850dd99425c5e5d479042a45e5de7.gif

对比之前的I2V-01模型,人物的动作都顺滑了很多,体验就像是从24帧提升到了60帧。

更复杂的插画和水彩风格也轻松拿捏了:

886ef186f5c24e3daa4e1f5938fcde79.gif

36dfc0a75b3051c7dd25e69d7bb160e6.gif

再比如知名博主海辛Hyacinth尝试的中世纪插画风格:

a183f133035a864b79f85178ddb1d7d7.gif

还有类似经典动漫《超时空要塞》风格的飞船片段:

ed9af41e3e10d4072f7032e53df5ec82.gif

自带镜头调度的经典日本动漫风格+武士元素:

87f6980867caf6ee2636d4c2b95f7568.gif

甚至连水墨风格、插画风格、熟悉的迪士尼3D风也都可以:

f7cae28d2498b63c0ac3e362a4203631.gif

1bae639fe715dfaab8f373513e0fbeed.gif

47488ba87a225618ccc49dffce16a6a4.gif

国产AI视频模型之光

提到MinMax的海螺AI(Hailuo),事实上已经在外网的视频创作社区里火了很久了,是这一波国产AI视频模型里面绝对的国产之光!

6d7cb830b6dff9e1e4f450945d70a261.png
349cc0207b19c0182888724e5a472ea4.png

Vbench(知名视频生成模型的测试基准)的多个维度上,它都名列前茅,尤其是在画面的生成质量维度上,拿下了第3名的好成绩。

5ac4e970f7c48e1bbb3ac64c5a1356e4.png

0d06df8091001454433a3ebde91e6e6a.png

此前也经常被国内外网友用来搞一些奇怪的meme或者影视剧二创

比如恶搞《黑客帝国》:

3f2cf97621bea02f4d6634402f665315.gif

还有专业电影导演Dave Clark用海螺生成非常有质感的科幻电影片段:

7133167db025e54fc1d7ecaff4ca5ed9.gif

多位网友表示,海螺模型的优点主要是生成表情更细腻动作更流畅方面。

一起看点例子感受一下:

比如下面这个国外爆火的视频,画面的女人瞬间就从大笑变成了掩面哭泣,但是变化过程非常自然,看着还很有代入感:

69da5afd834a3e53468ca19956f59591.gif

仔细观察还能看到小姐姐的眼眶的泪光逐渐增加,还有眉头慢慢皱起的过程,这演技绝对影后级。

生气、伤心、害怕、惊讶……多种表情都可以快速生成:

ce9a1057f9959f3f58f2bbab6515dd66.gif

再看看下面这个海螺生成的奔跑画面,作者表示,不仅生成更加自然,而且在角色的一致性控制上也非常完美。

29501fe0828ed4f551cec9b844d385f3.png

90be197aafd6085f57cec937edf2d376.gif

One More Thing

在图像和视频生成模型的下半程,海螺专注发力二次元风格,而其他各家公司也都开始主打“风格化”、“差异化”

比如Runway的frames功能,可以联动修改多个相关画面:

405756e507e9c0304f53cde5510573ad.png

还有最近爆火的recraft的复古胶片风图像:

3b3c993b15cb9011a51dcdc4d93431c6.png

269466e55f6e755f3dae69d8f54f1996.png

4afc14dd0719778ba9a72103ce0c8800.png

以及刚刚开源的腾讯混元的写实主义:

ac099317f84c03f1d1fc6c478280cc44.gif

224c9c47e520f24b55e4518628239841.gif

有艺术家评论道,以后挑模型就像是在挑选不同风格的相机品牌一样了,真的很有趣!

fd09ba07952379326559d1b0889e7344.png

参考链接:
[1]https://x.com/Hailuo_AI/status/1863961575574622662
[2]https://huggingface.co/spaces/Vchitect/VBench_Leaderboard

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值