今天我们从深度体验的角度,来对比一下目前最火的三大视频生成软件:Sora、可灵和即梦。
这三大软件的基本信息,以及最新可选模型分别为:
* 备注:为了公平起见,本文我们将全部以会员账号来进行测试。
本次我们将按照:生成速度、清晰度、氛围故事感和连贯性这4个维度,分别对这三款软件目前可选的5个版本模型(Sora Turbo、可灵1.5、可灵1.6、即梦S2.0 Pro、即梦P2.0 Pro)进行文生视频、单帧图生视频和多帧图生视频的全方位测评。
文生视频
首先,我们使用同一段提示词来分别测试一下这5个版本模型在文生视频上的生效果:
* 本次全部使用统一的英文提示词:A realistic movie scene featuring, a female warrior in red armor amidst a post-apocalyptic battlefield, with a war mech in the background. 一个真实感十足的电影场景,一名身穿红色盔甲的女战士置身于末日后的战场,背景是一台战争机甲。
以下是对比视频
▼
* 分数图例:★-一般,★★-良好,★★★-优秀
【总结】:单从纯文生视频(不使用其他辅助功能)来看,【Sora Turbo】和【可灵1.6】在各维度均表现优异,生成视频的整体效果领先于其他版本模型。
图生视频
由于Sora禁止上传以人物为主体的图片进行图生视频,所以我们将以非人物/人物分别来测试图生视频。
单帧图生视频(非人物为主体)
我们还是使用Midjourney先制作一张不含人物的图片
然后使用相同的视频提示词在这5个版本模型中分别生成视频
* 视频提示词(本次全部使用统一的英文提示词):The main subject, a red little snake, is enjoying the delicious food on the table. 主体的红色小蛇,正在享用桌上的美食。
以下是对比视频
▼
紧接着我们也同步测试一下以人物为主体的效果
单帧图生视频(人物为主体)
首先我们使用Midjourney制作一张包含人物的图片
然后使用相同的视频提示词在除了Sora Turbo以外的4个版本模型中分别生成视频
* 视频提示词(本次全部使用统一的英文提示词):The female warrior in red cast a reluctant glance at the camera before decisively charging toward the massive, steadily approaching mech enemy behind her. The shot focuses on the female warrior in red.身穿红色盔甲的女战士依依不舍地看了镜头一眼,然后果断地冲向身后那台缓缓逼近的巨大机甲敌人。画面聚焦在这位红衣女战士身上。
以下是对比视频
▼
结合非人物和人物作为主体进行的图生视频对比,我们不难看出:
* 分数图例:★-一般,★★-良好,★★★-优秀
【总结】:结合单帧和多帧模式下的图生视频效果来看,【可灵1.6】和【即梦P2.0 Pro】在清晰度、氛围故事感和连贯性上领先于其他版本模型。
尤其是【即梦P2.0 Pro】在本次的人物主体测试中,不管是主体人物看向镜头时眼神中流露的不舍,还是毅然决然转身冲向敌人的果断,都表现出了其他模型完全没有的“宿命感”!
相反,在文生视频中表现优异的【Sora Turbo】却在本轮测试中效果不佳。目前不仅无法上传有人物主体的图片,而且以非人物为主体生成的视频也会有动作生硬不连贯,背景细节不符合常理等情况出现,表现相对较弱。
多帧图生视频
从单帧图生视频的结果看来,主体为人物/非人物对于结果影响不大,所以多帧图生视频我们就统一使用非人物来测试。
我们使用Midjourney制作一张首帧和一张尾帧的图片
(1)Sora
Sora实现多帧使用的是StoryBoard故事板功能,所以我们在首帧和尾帧之间用提示词写了一段故事描述,最终生成了如下视频片段:
* 故事描述:A fluffy giant panda cub climbs a tall tree in a serene forest and lies comfortably on a sturdy branch for a nap. Sunlight filters through the canopy, casting a warm golden glow on its black-and-white fur. The tranquil forest, with gentle birdsong and rustling leaves, creates a peaceful and heartwarming scene. 一只毛茸茸的大熊猫幼崽爬上一棵高大的树,在一根结实的树枝上舒适地小憩。阳光穿过树冠洒下,为它的黑白毛皮镀上温暖的金色光辉。宁静的森林中,鸟鸣轻柔,树叶沙沙作响,营造出一个平和而温馨的画面。
(2)可灵
由于可灵1.6不支持多帧,所以我们使用可灵1.5来测试。在可灵1.5中有单独上传首帧和尾帧的界面。
创意描述部分,我们沿用和Sora相同的故事描述,最终生成了如下视频:
P.s. 经过多次尝试,可灵1.5是我们测试的软件中唯一一个在多帧图生视频的条件下可以做到前后动作符合规律,丝滑连贯两帧画面的模型。
(3)即梦
即梦实现多帧使用的是自有的“故事创作功能”,需要在每一帧都添加提示词描述,于是我们将相同的故事描述拆分成两段后分别填入分镜描述。
分别使用S2.0 Pro和P2.0 Pro模型,便得到了如下视频:
▼
* 分数图例:★-一般,★★-良好,★★★-优秀
【总结】:如果你需要将前后画面完全一致的连贯起来,类似于“一镜到底”的展现手法,那么【可灵1.5】的多帧视频生成模式更加适合。如果使用的是“分镜”的展现手法,那么【Sora Turbo】的StoryBoard故事板功能以及【即梦S2.0 Pro】和【即梦P2.0 Pro】的故事创作功能都能够实现多帧图生视频。
经过测试,这5个版本模型在对应所需场景里表现的都还不错,所以大家可以根据最终的呈现形式是“一镜到底”还是“分镜”来大胆选择~
解锁更多玩法
1、【可灵】定向剔除不希望呈现的内容
可灵的这一选项可以定向剔除一部分内容,适合于已有明确的画面内容的情况下。
2、【即梦】可根据需求选择不同的模型(S2.0 Pro/P2.0 Pro)
S2.0 Pro:在图生视频场景侧重“首帧一致性”
P2.0 Pro:拥有极高的提示词遵循能力
3、【Sora】的“隐藏用法”集锦
(1)StoryBoard故事板功能的真正用法(集锦视频00:01:17-00:17:13)
在Sora的StoryBoard故事版功能中,我们可以用纯文字描述多个关键帧,Sora就可以自然串联每个关键帧之间的画面。如这个功能的名字一样,让整个视频如同一个完整的故事。这样用纯提示文字生成的视频比我们在多帧图生视频的测试结果优秀得多。
(2)Recut重新剪辑功能(集锦视频00:17:13-00:34:29)
在Sora的Recut重新剪辑功能中,我们可以删除不喜欢的片段并重新生成,且重新生成的视频能够和原视频保留下的部分衔接的非常自然。
(3)Remix视频局部重绘功能(集锦视频00:30:15-01:01:22)
在Sora的Remix视频局部重绘功能中,我们可以在已经生成的视频里,用自然语言修改视频中局部物体,比如把老房子改成城堡,把书房改为热带雨林等。
(4)Blend视频混合功能(集锦视频01:01:22-01:13:25)
Blend视频混合功能可以混合2段视频生成新的视频,并且相对来说较为连贯。可以理解为除了文生视频、图生视频以外另一种新的功能:视频生视频。
(5)loop视频无限循环功能(集锦视频01:13:25-01:35:26)
loop功能可以重新编辑视频首尾,让视频变成首尾无限循环的模式。这样的视频很适合做成动态背景。
我们将【Sora】的这些“隐藏用法”的视频介绍汇总成了以下集锦,请大家对应查看:
* 视频均来自如OpenAI官网<https://openai.com/sora>
P.s. 说到这里不得不提一下,如果你是非会员用户的话,首先【Sora】是无法使用的,【即梦】生成一次视频的时间大概是几十分钟,而【可灵】生成一次视频的时间大概是几个小时。考虑到视频生成后的调整、筛选、后期编辑,成为会员是提高效率最直接的一种方式。
那么大家觉得,哪一款视频生成软件才是你们认为最好的呢?欢迎在评论区留下你的看法和我们进行互动哦!
--- End ---
欢迎关注微软 智汇AI 官方账号
一手资讯抢先了解
喜欢就点击一下 在看 吧~