【2025版】多场景对比，现在谁是最强视频生成模型？从零基础到精通，精通收藏这篇就够了！

最新推荐文章于 2025-05-22 20:10:07 发布

leah126

最新推荐文章于 2025-05-22 20:10:07 发布

阅读量877

点赞数 20

分类专栏：程序员大模型训练人工智能文章标签：开发语言大模型开源 OpenAI 计算机人工智能大模型应用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leah126/article/details/146111109

版权

程序员同时被 3 个专栏收录

1430 篇文章

订阅专栏

326 篇文章

订阅专栏

大模型训练

65 篇文章

订阅专栏

OpenAI的正式版Sora终于上线了！

不过，在Sora缺席的10个月里，Runway、可灵、海螺、混元等等模型都横空出世，有的甚至都卷出了自己的特色风格和功能，比如Runway的多帧修改、可灵生成的表情更加自然、海螺的二次元风格等等。

接下来我们就来一起看看，Sora和这些模型的对比效果究竟如何吧！

Round1：对比Runway

Runway是美国目前最受欢迎的视频生成模型之一，很多创作者已经用它来进行视频生产了。

下面我们就一起来看看3个Runway Gen3与Sora的对比

场景一：罗马教堂风的视频

先让两个模型都生成一些罗马教堂风的视频，可以看出来两个模型的重点不太一样，Sora生成了一个会议的场景，而Runway生成的视频更类似于节日聚会。

场景二：生成人物行走视频

这次生成的是一个男人穿着圣诞衣服在冬天的雪地里行走，两个模型的生成效果都很不错，Sora生成的更有故事感一些，还有背景变换和镜头切换。

场景三：根据输入的靴子图片自动生成视频

这次Sora的表现就出现了一些反常识的现象，从静止的靴子里面又出现了另一双走动的靴子，Runway生成的效果就好多了。

有网友看完也是立马锐评到：看起来OpenAI是用UI设计来弥补模型效果不佳

Round2：对比可灵

对比完两个外国模型，把我们国产模型也拉出来比划一下！

首先请出的是非常受欢迎的可灵模型，不仅是这次效果对比中有很多网友都用到了它，在过去的几个月中可灵也收获了很多用户。

场景一：Sora VS 可灵 VS Runway

金毛狗狗在美术馆中奔跑（Sora展示的官方场景之一）

‍

‍

三个模型在光影处理、动物毛发光泽和运动姿态方面处理得都很优秀，这一局有点难分上下，评论区里面喜欢Sora和可灵的都有。

场景二：Sora VS 可灵

根据输入的图片生成视频，没有提示词。

‍

可灵生成的视频看起来似乎动作更加流畅一些，不过Sora的画面切换也是很有蒙太奇的感觉。

Round3：对比海螺、混元

国产模型还有更多选手申请出战！

接下来有请海螺模型和混元模型上场。海螺自从推出以来就一直在VBench榜单上名列前茅，混元模型虽然开源不久，但是也有很多艺术家都进行了创作尝试。

下面一起看看他们的表现：

场景一：Sora VS 可灵 VS 海螺，图生视频

这道题就是一个非常考验模型想象力的题目了，同样是图生视频，三个模型根据一个人站在金字塔下的身影进行视频生成。Sora和可灵的主题都比较偏向“末世”的感觉，海螺有点“异世界”战斗即视感。

‍场景二：Sora VS Runway VS 可灵 VS 海螺

输入是“维京演员的情感表现，摄像机推进至演员皱眉的脸部”。

Sora生成的视频中还有拍摄演员的视角变化，很有趣。可灵和海螺在处理面部表情时更加自然。

场景三：Sora VS 可灵 VS 混元

再来看看最后一个测试，让模型们幻想月球上面宇航员的活动。

可以看出来，每个模型都有自己的偏好，Sora的视频镜头变化更多、可灵的场景更加细致、混元的更有故事感。

Round4：视频忠诚一致性检测

网友Shaun Ralston还用自己的猫猫测试了一下Sora生成视频中物体的一致性。

首先来看看他的真猫写真：

下面都是Sora根据输入的图像生成的AI猫猫图像，看起来基本上和真实的猫差别不大，而且视频中的动作也非常自然。

‍

One More Thing

Sora正式版推出之后，大家最关心的除了效果可能就是价格了。

目前Sora只向Plus会员（每月20刀）和Pro会员（每月200刀）开放。具体来看，Plus会员每月最多可生成50支视频，720p分辨率最多生成5秒，480p分辨率可以生成10s。Pro会员每月可生成500支视频，支持1080p、20s、同时生成5个视频，还支持无水印下载。

但是，独立电影制作人el.cine在X上发推表示，如果你想要用包含人物的图像来生成视频，这个功能目前只对Pro用户开放！

参考链接：
[1]https://x.com/emollick/status/1866227921893105975

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

## AI大模型学习福利

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2025最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2025最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2025最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2025最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

四、AI大模型商业化落地方案

因篇幅有限，仅展示部分资料，需要点击下方链接即可前往获取

2025最新版CSDN大礼包：《AGI大模型学习资源包》免费分享

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。