全新豆包AI视频模型发布!实测下的可灵与豆包!原来它们的差距不止一点点...

字节全新豆包AI视频模型——PixelDance和Seaweed模型刚发布,AI博主“数字生命卡兹克”就对其进行多方位实测。

当小编看到具体实测后,也彻底惊呆了...“这真的不是真人秀吗?”

随后不禁又产生疑问,豆包和其他的AI视频工具相比,谁才是老大?

在博主文章的末尾,看到这位粉丝提出这样的疑问

全新的豆包AI视频模型居然可以完胜火遍国内外的可灵?为了验证心中这个疑问,小编将实测可灵人物的复杂连续动作,多镜头组合视频,极致的运镜控制三个角度出发,与博主实测的全新豆包AI视频模型成果进行对比,

一、人物的复杂连续动作

博主在文章中让图中女生,摘下墨镜,站起身,然后走向雕像。

博主实测豆包PixelDance:查看视频

可灵使用相同的图片进行实测 :查看视频

00:05

小编在使用可灵生成时,运用了其中的运动笔刷,绘制女人行走到雕塑的运动轨迹,但可灵生成的女人不但墨镜没有摘下,感觉快要睡在了地上,无法完成“摘墨镜”“站起来”“走向雕像”的一连串动作。

虽然豆包PixelDance在最后没有走向图片中的白色雕像,但是它比可灵更好的完成了摘墨镜,站起来的连续动作。人物神情复杂程度上,可灵会不会比豆包更好呢?博主po出使用豆包PixelDance生成一个老人笑着笑着,就哭了的实测。

动图封面

虽然表情顺序有稍许不同,先表现出老人眼眶含泪,然后表现老人微笑,但是它将老人的神情表现刻画的更细腻——红了的眼眶,视频末脸颊上出现的泪滴,媲美真人表现。

让我们再看看可灵实测 :查看视频

00:05

可灵视频中,老人表现出大多是悲伤的神情,缺少笑的表现,连续神情的变化,可灵在视频中没有体现。

小结

人物的复杂连续动作能力,可灵输给了豆包。经过连续人物动作测试和人物连续表情测试,可灵最多表现出其中一个点,而豆包呈现的视频包含了所有动作和表情,并且衔接的非常流利自然。

除此之外,可灵的文本指令理解能力比豆包差了很多。可灵只做了拿手去摘墨镜的动作,墨镜依然在脸上;让女孩站起来却变成要睡在了地上。这让小编感到十分的不理解。在第一轮比拼中,豆包获胜。

二、多镜头组合视频

博主在文章中表明,如今除了豆包PixelDance,依然没有任何一个AI视频,能做到单视频多镜头,而且还能保证完美的一致性。表示豆包PixelDance表现出的一致性简直无敌,只需要一张图+Prompt就行。

如果我们在可灵上也使用一张图+Prompt进行视频生成,也可以完成多镜头的表现吗?

我们采用与博主一样的Prompt:拿着镰刀的死神朝女人走近。镜头切换,特写女人的脸,她惊恐地尖叫。

博主实测豆包PixelDance :查看视频

00:10

点击查看可灵实测:

很显然,可灵无法完成,它只完成了提示词中的一个镜头——死神走向女人,并没有切换到女人惊恐的镜头。并且可灵视频中呈现的死神,脸部五官逐渐模糊扭曲。让我们再给可灵一次表现的机会。

依旧采用与博主同样的Prompt:白色机器人抬起双手拿着一把步枪对着画面左侧不断射击。枪口射出一道绿色的能量光线。镜头切换,画面左侧是一个黑色的机器人,一道绿光从画面右侧快速射入,击中了它的身体,黑色机器人被击倒并爆炸。镜头切换,背面拍摄白色机器人,它望向远处的爆炸,转身走出了画面。博主实测豆包PixelDance:

00:10

豆包PixelDance却丝滑的完成了两次镜头切换,并准确的表现出提示词的所有内容。可灵实测 :查看视频

00:05

可灵对于提示词中“两次镜头切换”内容没有表现好:黑色的机器人变成黑色的屏幕,更没有一道绿光从画面右侧快速射入击中它的身体。更没有镜头再次切换到白色机器人望向远处的爆炸,转身走出画面。

小结

第二轮实测比拼,可灵又再一次输给了豆包。在没有点开可灵第四次实测时,封面中出现的白色机器人,绿色光线,远处爆炸的场景,让小编一度以为可灵终于可以站起来一次了!当激动的点开视频,看到画风越来越偏。有时候也很佩服AI的想象力,我实在没有想到镜头切换的黑色机器人可以用黑屏来代替。

和清影、VIdu、runway、pika等其他AI生成工具一样,视频的开头总是那么完美的,这让小编十分的抓狂。现在全新豆包AI视频模型的出现,希望可以为我们带来新的突破!

三、极致的运镜控制

豆包PixelDance模型的运镜,博主说是他见过最离谱,最牛逼的,并且各种360度围绕主体环绕、前后景变焦、摇摄、目标跟随、升降镜头等运镜都可以表现。

博主实测豆包PixelDance :查看视频

00:09

不得不夸赞豆包PixelDance的表现力!我从未见过这么丝滑的各种运镜组合!低头表现了升降镜头运镜;镜头拉远慢慢出现了白人男人,表现出前后景变焦;视频呈现出白人男人的摇摄运镜...真的和真人拍电影一样,看不出区别!

那么可灵也可以有这样的表现吗?

同样使用测试过豆包的Prompt:女人微笑着低下头,镜头拉远,一个白人男人注视着这个女人。

00:05

很遗憾,可灵的运镜表现力较差,对于提示词中的“低下头”、”镜头拉远“没有体现,更没有出现提示词中的白人男人。

豆包又扔出重磅炸弹!博主实测豆包PixelDance360度大幅度环绕运镜!而且只使用Prompt+图片组合.... :查看视频

Prompt:黑白风格,镜头环绕着戴墨镜的女人拍摄,从她侧面移动到正面,最后聚焦于女人的面部特写。

00:10

小编又又又使用同样的Prompt去测试可灵,视频我就不呈现了,可能...也许...它有它自己的想法?可灵只呈现女人带墨镜形象,其他黑白风格,侧面移动到正面,最后聚焦于女人的面部特写,统统都没有。

小结

第三次实测对比,可以判断目前的可灵真的输给了豆包。

两次的运镜控制测试,可灵无法完成指令中的所有运镜,更暴露出文本指令遵从能力较差。但豆包可以将多种运镜手法这么自然的融为一体,让小编不断产生错觉,感觉就是真人在表演。同时我们离“人人都可以当编导,人人可以完成一部影视作品”的目标越来越接近。

豆包表现真的让我感到十分的兴奋!也同时感叹AI技术进步的如此之快!在今年4月小编制作AI视频,还需要利用PS等其他不是AI的工具参与制作,如今只需要Prompt+一张图片就可以搞定!不禁畅想未来,还会有什么样的惊喜在等着我们!

总结

“数字生命卡兹克”博主说的对,可灵目前真的被豆包甩在了身后,而且差距并不是一点点。

在我们之前测试国内外生成视频工具文章中,即梦就已经超越了可灵以及其他国内外AI生成视频工具,位列第一!这次通过以上的实测对比,让小编更想立马去即梦亲身体验豆包PixelDance模型的厉害!

但博主透露,豆包PixelDance模型会优先对企业开启邀测,过几天上线火山方舟,上线即梦向C端用户全员开放的时间暂不清楚,团队想再次优化模型的能力。

好事多磨!到正式开放全员使用的那天,也许比博主实测的视频呈现效果还要惊艳!让我们拭目以待吧~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值