可灵AI收费了!而且超级贵!不是用不起,而是平替更具性价比。
视频软件非常多,Pika、Pixverse、Runway、dreamina、无界等等,但是都收费,而且价格不菲。
最后我终于找到了免费的平替SVD 1.1,而且效果也非常棒
0元平替AI视频制作:轻松实现创意视频
这款免费AI视频制作工具,让你能够以0元的成本,实现创意视频的制作。通过简单的操作,你就可以将静态图像、音频和文字转化为动态视频,让你的创意更加生动和有趣
一、用全免费软件制作 AI 短片
本案例使用的工具如下:
文本大模型使用的工具是:KIMI
文生图、图生视频使用的工具是:ComfyUI+SVD工作流
(需要的同学可以自行扫描获取)
二、使用 KIMI 生成剧本、分镜、提示词
KIMI (https://kimi.moonshot.cn/)是国产文本大模型,非常擅长文章创作,能够学习200万字的文章,并进行二创。
一)剧本提示词
我们登录 KIMI
,并把如下提示词输入文本框:【你现在是一位知名的短视频导演要拍摄一段1分钟左右的视频科幻故事短片,介绍一个来自外太空的科技文明的故事,需要在开头的五秒钟抓住用户的兴趣点,请详细的撰写分镜脚本和旁白】。红色的地方可以根据你要创作的故事修改。
得到如下内容,不满意可以重新生成:
二)生成文生图提示词
上面我们生成分镜脚本是用来生成分镜图片的,为以后图生动画做准备。这里有个技巧,如果你想要多个分镜镜头,可以把【镜头】的句子拆开,多生成几个画面。提示词可以加入:广角、特写、全景、眼部特写等镜头语言描述,锁定镜头。本文演示就用整句的【镜头】生成提示词。【旁白】是用于后面剪映配音用的。
KIMI 生成 SD 咒语的提示词如下:(这里MJBOT是我随便给这个智能体起的名字,大家随意改)
MJBOT是一位有艺术气质的A1助理,帮助人通过将自然语言转化为prompt。MJBOT的行动规则如下:
1.将输入的自然语言组合想象为一幅完整的画面,你需要根据描述自行随机添加合理的,不少于5处的画面细节;
2.第一部分:((masterpiece)), ((best quality)), 8k, high detailed, ultra-detailed,
;
3.第二部分:用简短的英文描述画面的主体,如:Agirl sittinginaclassroom,输出这段英文;
4.第三部分:用英文单词或者词组描述画面的所有主体元素,元素之间用”“隔开,如果有哪个元素比较重要,请给代表这个元素的英文词组增加小括号,最多可以增加三层小括号,如:1girn,((blackhair)),smiling,(windowsin
background),sunshine,输出这段英文;
5.MJBOT 会将以上生成的三部分文本用英文逗号连接,中间不包含任何换行符的prompt作为最终结果;
6.MJBOT 输出时将直接输出 prompt ,而不包含任何说明和解释。接下来你将扮演MJBot,要处理的自然语言为:
【这里填写上面KIMI生成的分镜镜头】
生成的提示词如下:
三、使用 ComfyUI 文生图
ComfyUI 是基于 Stable Diffusion 内核的一款基于图形/节点/流程图的界面设计 AI
绘图生产力工具,其特点是一个流程图一旦设计完成,就能共享给其他人使用。
这里我已经把本文使用的工作流做好了,并分享给大家。(链接我+V:aishejilaozhao 获取,发送暗号:SVD)
**这一步,**按下图说明选择大模型和lora模型,并在正面提示词的位置填写上面 KIMI 生成的提示词。图片分辨率我们填写 1280x 720,批次填写
4 ,这样一次就能生成 4 张了。
这里,因为我们生成的图片大于1024的分辨率,所以大模型和 lora 模型必须是 SDXL 模型,这种模型的特点是模型的名称都带有 XL 的字样。
生成结果如下,图片非常清晰,也满足我们的要求。
四、使用 SVD 1.1 图生视频
接下来就是使用 ComfyUI 进行图生动画了,我们这里使用最新的 SVD 1.1
,最长可以生成6帧的4秒视频。什么只有6帧岂不卡成PPT?没关系,我们后面还有补帧工作流,6帧补到30帧。
这里我已经把本文使用的工作流做好了,并分享给大家。(链接我+V:aishejilaozhao 获取,发送暗号:SVD)
**这一步,**上传刚刚生成的图片,并按下图填写参数,开始等待生成视频。
最后我们看下生成的成果,真的卡的和PPT一样。
五、使用ComfyUI对视频放大、补帧
现在我们用 comfyUI 工作流对刚才的视频进行高清放大和补帧,让视频更加清晰、流畅。
这里我已经把本文使用的工作流做好了,并分享给大家。(链接我+V:aishejilaozhao 获取,发送暗号:SVD)
这一步,上传刚刚生成的视频,并按下图填写参数,开始放大、补帧。
我们来看看结果,非常流畅了: