VIDU迎来新版本升级，视频质量显著提升

最新推荐文章于 2025-04-30 14:29:39 发布

彩色蚂蚁

最新推荐文章于 2025-04-30 14:29:39 发布

阅读量1.6k

点赞数 41

分类专栏： AIGC应用文章标签：人工智能

本文链接：https://blog.csdn.net/colorant/article/details/145007612

版权

5 篇文章

订阅专栏

作者公众号大数据与AI杂谈（TalkCheap），转载请标明出处

2024年一整年可以说是AI视频的快速进化之年，年初各种产品才开始涌现，不到年底，不少主流成品就基本达到了商业可用的水平。11月份，我才把国内外相对主流和常见的AIGC视频生成产品都试用了一圈，做了一下总结：见 AIGC视频生成网站和工具大全：十六款产品功能，效果展示和价格比较

这才不到两个月，很多产品又做了很大的升级，近日，Vidu也将迎来新版本的更新（截止笔者这篇文章发稿，正在内测，应该很快就会发布），今天这篇，我来重点介绍一下Vidu最新产品的能力和实际效果

注：Vidu是生数科技和清华大学联合研发，国内最早的纯自研原创视频大模型，效果方面，一直也有不错的口碑

本文涉及的视频部分，无法插入，看视频Demo的可以去我的公众号看。

网址： https://www.vidu.studio/

相比两个月前，首先最直观的是网站设计的更新，以前的网页设计是非常非常的粗糙，一眼山寨，虽然产品质量过硬，但毕竟看脸的时代，好酒也怕巷子深。更新后的产品主页明显跟上了时代

Vidu相比其它AI视频产品，除了常见文生视频和图生视频，它的特色功能是参考生视频能力，可以通过上传1-3张图像作为参考，结合描述词的内容再生成视频。类似的参考图片的功能，在其它产品上，通常只能用在图像生成上，而不能用在视频生成上

那么这个功能有什么用呢？比如，你可以上传三张照片，一张人物，一张是物品，一张是场景，然后让它生成指定场景中的指定人物携带指定物品的视频。你也可以上传两个人物，让他们同时出现视频中，又或者只是一张脸，用来在多个视频中控制人物长相的一致性。具体怎么用完全取决于你的意图和目的

这么说比较抽象，我来举几个我之前实际制作的例子

比如，上图我上传了一张长着苹果脑袋的女孩和一张雪后故宫的照片，然后让Vidu生成一个“长着苹果脑袋的模特站在雪后的故宫里，身穿红黑色蕾丝晚礼服，修长的大腿，她面向前方迎面走来，优雅的姿态，脸带微笑，环绕拍摄的镜头，身后跟着两条拉布拉多犬。低角度仰拍”的视频

为什么举这个例子或者为什么要用参考生视频的能力来生成呢？这是因为长着苹果脑袋的女孩，和雪后的故宫都很难画！模特难是因为苹果脑袋不是常规人像，故宫难是因为建筑很难画得真实。其它生成方式基本都无法完成

可以看到，生成的视频完全符合我提供的内容，除了苹果女孩和故宫，额外描述的服装，动作，镜头角度，两条狗都得到了体现。

然后更长的例子可以看我做的这个 “白雪（苹果牌）公主和老巫婆”的MV，大量通过参考生视频的能力来实现特定人物的控制

更鬼畜一点，比如把苹果女孩的脸，换到蜘蛛女孩身上

总之，怎么用，取决于你的想象

说完参考生视频，来说一下图生视频在新的版本更新中带来的提升。主要是画质方面，以及首尾帧视频的生成质量上

比如使用两张陆家嘴的照片，通过首尾帧模拟生成航拍飞行，日夜转换的视频

生成视频比较如下，可以看到1.5版本的效果也还可以，不过两张图之间的转换，并不符合物理逻辑，而是通过云雾的遮挡，巧妙的做了转场（这已经比直接切换图片要厉害了），而新版就十分丝滑，没有通过任何遮挡就实现了几乎可以乱真的航拍视角转换效果

之前我大部分都是用图片生成人物类场景，因为画美女毕竟是AI最擅长的（因为训练素材多），这次多试了一些纯风光类场景，效果也让我很惊讶，以后可以再多尝试一些风景题材的创作了；）

应该说，Vidu的新版本，带来了令人惊喜的能力升级，因为各家产品都在快速迭代，而且生成内容，侧重点，使用方式的不同，很难说谁一定最强，但Vidu的生成质量和独特的参考生视频能力，使其稳居国内类似产品前三的位置，那是没有什么问题的

当然，新版本也还有不少可以改进的地方，比如人物做较大幅度的肢体运动时，快速运动的手指基本还是模糊扭曲的（当然，这也是大多数产品的难点），如果后续的版本这一点能进一步提升，那就更好了