AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

衡宇 发自 凹非寺   量子位 | 公众号 QbitAI

小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。

然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:

生成式AI,开始拍视频

还是带画外音的那种。

这个技术来自一个名为QuickVid的新网站,它把好几个生成式AI组合成了一个工具。

创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、

 5be1b139abdb7a038fbf2f171142bf0d.png

哇哦,Unbelievable~

QuickVid,明星AI产品杂烩

QuickVid,是个刚出生7天(去年12月27日推出)的小baby网站。

年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:

首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。

比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。

6e91f58563e3541795f803449647286c.png

这个功能,依托的是GPT-3的文本生成能力。

接着,根据这些提示,QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频,并使用DALL-E2生成覆盖图像。

然后,QuickVid会通过Google Cloud的文本到语音API输出画外音。

这一步可以选择克隆用户自己的声音。

因为创始人了解到,好多创作者对自己制作的AI配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。

最后一步非常简单,就是把上述元素合并

当当当当!一个AI生成的短视频就诞生了。

GPT-3、DALLE-2……总而言之,QuickVid像是一道现有AI产品的明星杂烩

并且,利用重复的、模版化的B-roll短视频格式,还避免了必须自己生成视频这一关。

值得关注的一点是,因为允许Copilot在GitHub的公共仓库上“偷代码”,微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。

这个案子对DALL-E2这类的AI产品有着深远的影响,因为人们发现AI可以从训练集中“抄袭”

不过QuickVid并不太担心,他的创始人Daniel Habib大胆放话:

如果明天出现一起让OpenAI消失的诉讼,我们也不怕。

因为我们有好几种替代方案可以为QuickVid提供AI生产力呢~

ea973336465da5e8d73d743d8817367d.png

这里提到的替代方案,是类似于DALL-E2的开源系统Stable Disusion,QuickVid已经在用它测试生成头像图片了。

Habib曾是Meta的员工,负责Facebook Live和视频基础设施的开发,他用几周的时间搞出了QuickVid。

根据一些媒体的实测,QuickVid生成的视频质量好坏参半

生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。

不过也不算稀奇,因为QuickVids目前背靠的仅限于Pexels,而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。

官方针对这一点给出的回应是,“我们每天都在修补bug哟”!

现在的QuickVid功能还比较简单,但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。

f4e465683403ee9ab07b7b5233f3cfbf.png

推特用户用QuickVid生成短视频

这个月,QuickVid会维护更新一些个性化功能。

摆在QuickVid们面前的几道坎

Habib在回复TechCrunch电子邮件时,将QuickVid称为为创作者提供快捷制作高质量内容的工具。

“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”

创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。

大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。

aa26a3dd334488d8ced45c6b54fb4175.png

没错,像QuickVid这样的工具,可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息,以及重复内容

回答相关问题时,Habib把相关责任归在平台身上。

他认为,是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。

“如果人们不想看你的视频,那么你在YouTube这类平台发了视频也传播不开。”他补充道,“不管你是不是使用QuickVid生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”

当然,站在QuickVid面前的难题显然不止这一个,它面临诸多问题考验。

比如有创作者的潜在抵制

不管是因为成本问题(QuickVid的包月费用是10美元/月),还是因为会面临与AIGC抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。

ae5b64c3952f16e9d177777a92fb4d9a.png

再比如版权问题

根据Habib的说法,QuickVid用户们可以将自己生成的视频商用,但是AIGC的版权问题本就处于暧昧不明的阶段。

就前几天的事儿,美国专利和商标局(USPTO)撤销了对AI漫画的版权保护,称要获得版权保护需要人工授权

不过,Habib觉得USPTO的这一行为跟QuickVid没啥直接关系,因为那只涉及AI产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。

创作者关心的是放出高质量的内容,帮助频道涨粉。

939943cc0521227b2b7bc212b828ebbc.png

除了法律问题,摆在QuickVid面前的还有内容审查这个大工程。

虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但bug依旧存在。

GPT-3时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。

这对ChatGPT来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。

当Techcrunch进行测试时,QuickVId在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑

对此,QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。

同时还动员每一个使用QuickVid的用户,宣称大伙儿有义务手动审查每一个由QuickVid创建的视频,以确保“一切都在法律的范围之内。”

One More Thing

不过有个值得令QuickVid们小兴奋的消息,那就是谷歌并没有区别对待人写文本和AI文本。

不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。

这就让QuickVid们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。

36f2bbc0b6c837466028ff51bc5057ad.png

不过说到底,如Habib所说的那样,生成式AI革命是不可阻挡的。

如果AI生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样——至少不会全面禁止它。

你会因为有了这样便利的工具,成为短视频平台的创作者吗?

也许今晚打开短视频App刷到的第一个推荐就是你的(手动狗头)。

直达链接:https://www.quickvid.ai/
(由于涌入人数过多,现在注册需要排队了,我恨)

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

483bed03f8e06fc1610df7f23b43856d.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

b2c1a51169b3b2660628fb9fab6b91f0.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值