VIDU迎来新版本升级,视频质量显著提升

作者公众号 大数据与AI杂谈 (TalkCheap),转载请标明出处

2024年一整年可以说是AI视频的快速进化之年,年初各种产品才开始涌现,不到年底,不少主流成品就基本达到了商业可用的水平。11月份,我才把国内外相对主流和常见的AIGC视频生成产品都试用了一圈,做了一下总结: 见 AIGC视频生成网站和工具大全:十六款产品功能,效果展示和价格比较

这才不到两个月,很多产品又做了很大的升级,近日,Vidu也将迎来新版本的更新(截止笔者这篇文章发稿,正在内测,应该很快就会发布),今天这篇,我来重点介绍一下Vidu最新产品的能力和实际效果

注:Vidu是生数科技和清华大学联合研发,国内最早的纯自研原创视频大模型,效果方面,一直也有不错的口碑

本文涉及的视频部分,无法插入,看视频Demo的可以去我的公众号看。


网址: https://www.vidu.studio/ 

图片

相比两个月前,首先最直观的是网站设计的更新,以前的网页设计是非常非常的粗糙,一眼山寨,虽然产品质量过硬,但毕竟看脸的时代,好酒也怕巷子深。更新后的产品主页明显跟上了时代

图片

Vidu相比其它AI视频产品,除了常见文生视频和图生视频,它的特色功能是参考生视频能力,可以通过上传1-3张图像作为参考,结合描述词的内容再生成视频。类似的参考图片的功能,在其它产品上,通常只能用在图像生成上,而不能用在视频生成上

那么这个功能有什么用呢? 比如,你可以上传三张照片,一张人物,一张是物品,一张是场景,然后让它生成指定场景中的指定人物携带指定物品的视频。你也可以上传两个人物,让他们同时出现视频中,又或者只是一张脸,用来在多个视频中控制人物长相的一致性。具体怎么用完全取决于你的意图和目的

这么说比较抽象,我来举几个我之前实际制作的例子

图片

比如,上图我上传了一张长着苹果脑袋的女孩和一张雪后故宫的照片,然后让Vidu生成一个“长着苹果脑袋的模特站在雪后的故宫里,身穿红黑色蕾丝晚礼服,修长的大腿,她面向前方迎面走来,优雅的姿态,脸带微笑,环绕拍摄的镜头,身后跟着两条拉布拉多犬。 低角度仰拍”的视频

为什么举这个例子或者为什么要用参考生视频的能力来生成呢?这是因为长着苹果脑袋的女孩,和雪后的故宫都很难画!模特难是因为苹果脑袋不是常规人像,故宫难是因为建筑很难画得真实。其它生成方式基本都无法完成

图片

可以看到,生成的视频完全符合我提供的内容,除了苹果女孩和故宫,额外描述的服装,动作,镜头角度,两条狗都得到了体现。

然后更长的例子可以看我做的这个 “白雪(苹果牌)公主和老巫婆”的MV,大量通过参考生视频的能力来实现特定人物的控制

图片

更鬼畜一点,比如把苹果女孩的脸,换到蜘蛛女孩身上

图片

总之,怎么用,取决于你的想象

说完参考生视频,来说一下图生视频在新的版本更新中带来的提升。主要是画质方面,以及首尾帧视频的生成质量上

比如使用两张陆家嘴的照片,通过首尾帧模拟生成航拍飞行,日夜转换的视频

图片

生成视频比较如下,可以看到1.5版本的效果也还可以,不过两张图之间的转换,并不符合物理逻辑,而是通过云雾的遮挡,巧妙的做了转场(这已经比直接切换图片要厉害了),而新版就十分丝滑,没有通过任何遮挡就实现了几乎可以乱真的航拍视角转换效果

之前我大部分都是用图片生成人物类场景,因为画美女毕竟是AI最擅长的(因为训练素材多),这次多试了一些纯风光类场景,效果也让我很惊讶,以后可以再多尝试一些风景题材的创作了 ;)

图片

应该说,Vidu的新版本,带来了令人惊喜的能力升级,因为各家产品都在快速迭代,而且生成内容,侧重点,使用方式的不同,很难说谁一定最强,但Vidu的生成质量和独特的参考生视频能力,使其稳居国内类似产品前三的位置,那是没有什么问题的

当然,新版本也还有不少可以改进的地方,比如人物做较大幅度的肢体运动时,快速运动的手指基本还是模糊扭曲的(当然,这也是大多数产品的难点),如果后续的版本这一点能进一步提升,那就更好了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值