没想到我还要求着AI动起来（Stable Diffusion进阶篇：ComfyUI SVD图片转视频）

最新推荐文章于 2024-12-26 15:11:57 发布

AIGC阿道夫

最新推荐文章于 2024-12-26 15:11:57 发布

阅读量1.5k

点赞数 17

文章标签：人工智能 stable diffusion 音视频 aigc AI作画 ai绘画人工智能作画

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/text2203/article/details/141062414

版权

在数字艺术领域，AI绘画技术已经逐渐成为艺术创作的新趋势。Stable Diffusion（SD）作为一款领先的AI绘画工具，推出了ComfyUI SVD图片转视频功能，让你能够轻松实现静态图片的动态化。现在，让我们一起来探索Stable Diffusion的ComfyUI SVD图片转视频功能，开启你的创意之旅。

如果是已经接触过WebUI的小伙伴们来说这篇文章还是很好上手的。

在这里插入图片描述

在上篇文章的结尾我简单地操作了一遍ComfyUI并且用动图演示了一下：

这个就是ComfyUI的一个完整的工作流程，像我这样的比较懒的可能会觉得要是想增加其他功能要连线什么的好麻烦，这个时候有一个简单的方法。

打开ComfyUI的官方Github链接：

https://github.com/comfyanonymous/ComfyUI

选择这个ComfyUI Examples，打开之后会有很多工作流程：

然后点击进入，例如我点开这个3D，就会进入到这样的页面

然后将这张图片保存到本地，之后只需要将图片拖到ComfyUI界面中，系统就会自动识别到这个工作流程并更新。

怎么样，是不是超级无敌方便，同时也可以根据自己的喜好对工作流进行微调，之后记得点击右侧的Save保存即可，这样也方便后续的导入使用。

好了，简单的介绍学习就到这里，让我们来进入今天的正题吧！

SVD的准备工作

虽然之前可能讲过但是这里再复习一次，SVD全称是Stable Video Diffusion稳定视频扩散模型，是由Stabilityai公司开源发布的图像转视频的潜在扩散模型。

从结果上看Svd的生成效果略优于pika和runway(Gen2)，同时SVD是免费开源的模型。

免费的东西谁不喜欢呢？只需要在Hugging face上下载svd模型就可以。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/tree/main

这里有两个模型，分别是svd模型和svd xt模型，之前下载过的小伙伴可以不需要再下载。

这两个模型的区别在于svd模型可以生成14帧的动画而svd xt可以生成25帧的动画，如果设备比较不错例如3060以上性能的可以下载svd xt试试。

除此之外还需要安装一个节点软件：ComfyUI-VideoHelperSuite

https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite

如果之前学过animatediff就应该下载过，这个插件在工作流中需要用到video combine模块，这模块可以方便保存和导出不同格式的视频。

这些节点软件下载好后都要解压放在这个custom_nodes文件夹中：

**根目录:\ComfyUI\ComfyUI_windows_portable\ComfyUI\custom_nodes
**

准备完毕之后就正式开始今天的学习啦！

**SVD的使用（逐步操作）
**

第一步：

打开ComfyUI保持默认的工作流，然后在空白处鼠标左键双击输入SVD，然后就会弹出SVD_imag2vid_Conditioning

这个模块的功能是以SVD图片转视频为条件

第二步：

‍由于SVD_imag2vid_Conditioning上并没有可以连接Checkpoint的地方，所以要点击‍Clip_vision往左拖拽，选择Image Only Checkpoint Loader(imag2vid model)‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

并且将模型上的VAE节点连接回SVD的vae上，这样Clip bision节点就连接好了。

在这里插入图片描述

接下来就把红色框内的模块都删除掉，用不着了

第三步：

在空白处鼠标左键双击，搜LoadIMAGE，这样得到的模块可以将用来转为视频的图片加载进来。简单来说就是用来放想要动起来的图片的。

并且将图片节点连接到int_image上

第四步：

将前两个模块分别连接到KSampler上，分别对应正提示词、负提示词、潜空间和模型。

**第五步（接下来我的电脑出现了点问题，部分演示暂时用教程视频截图替代）：
**

鼠标左键双击空白处，输入VideoCombine得到该节点。

在这里插入图片描述

这个节点是需要下载了先前的VideoHelperSuite才有，然后将VAE与该节点进行连接，目的是为了能够更好地把输出的图片序列转换为视频。

与此同时将filename_prefix也就是前缀改为svd，format视频格式改为video/h264-mp4

第六步：

在鼠标右键查看图像属性后，将对应的原图像宽高输入进SVD_img2vid_Conditioning中

然后再将一条VAE的线从Image Only Checkpoint Loader连接到VAE Decode

第七步：

这个时候其实已经可以生成动图了，但是在这个情况下生成的结果颜色差异会过大画面崩坏。

究其原因是因为KSample上的CFG数值为8，在文生图的情况下CFG的数值为5-8，而使用SVD的时候建议数值为1-3区间。

当CFG越接近1，其初始图像对画面的控制力就越小。但是因为这里用的初始图像是人物，所以将CFG值改为3最好。

这样图像效果看着还可以（取自原视频教程演示）

‍**第八步：**‍

虽然看着已经差不多了，但是需要一些操作。这里空白处双击鼠标右键，输入VideoLinearCFGGuidance。

‍这个模块通过跨帧缩放CFG来进行视频采样，听着有点像之前的Ebsynth。

根据原教程来说：距离初始图像距离较远的帧会逐渐接受较高的CFG值。

将这个模块与SVD和KSample连接起来

再次生成试试看：

在这里插入图片描述

可以看到人物的动作更丰富了些，但是由于初始CFG值较低，肢体和面部会有比较明显的崩坏感。

第八步：

接下来就需要到SVD中进行参数调整

这个width和height很好理解，就是生成视频的宽高，建议尺寸在1500以内。

video_frames就是生成的运动帧数，根据硬件设备条件设置，一般推荐在25帧以内。

motion_bucket_id数值越高，输出画面中的运动幅度就越大。一般数值在100以内，最多不超过200。

FPS(frames per second)就很好理解了，就是每秒的帧数，在这里一般为6或者8。

agumentation_level是指添加到输入图像的噪声量，较高的噪声会降低与输入图像的相似度，一般在0.1以内最多不超过0.5

将参数调整后再试一次：

适当地增加Augmentation_level并不会使得画面崩坏，反而使得人物动作更加自然。

在视频制作中CFG、Motion_bucket_id和augmentation_level都是需要进行动态调整的，不同的画面主体需要不同的参数，实在不知道要怎么做的可以使用下面的官方推荐参数：

**问题总结：**‍

目前的操作过程中有个问题可能会出现

有些同学可能找不到Video Combine跟我一样，那就有几个可能，第一是VideoHelperSuite没有放在custom_nodes文件夹中。

如果确认在文件夹中但是仍然没有搜索到的话可以有两个选择，下载一个管理包（连接在文末），用管理文件来下载插件：

如果出现了下载失败的情况，那我暂时也没办法，可以私信我我找到办法了就回复。

第二种选择是去B站搜索秋葉启动器，之前一直用的是WebUI版本其实也有ComfyUI版本可以下载。

如果还有什么其他问题可以看原视频教程的评论区，我会把链接都放在文末。

那今天的内容就到这里结束啦！大伙下篇笔记见，拜了个拜！

1girl, upper body, psychedelic, latex bodysuit,wavy hair, splashing, abstract background

Negative prompt: (worst quality:2), (low quality:2), (normal quality:2), lowres, bad anatomy, watermark

Steps: 20
Sampler: DPM++ 2M Karras
CFG scale: 7
Seed: 3403042071
Size: 512x512
Model hash: e4a30e4607
Model: majicmixRealistic_v6
Denoising strength: 0.7
Clip skip: 2
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+
Version: v1.6.0-2-g4afaaf8a0

资料软件免费放送

次日同一发放请耐心等待

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

感兴趣的小伙伴，赠送全套AIGC学习资料和安装工具，包含AI绘画、AI人工智能等前沿科技教程，模型插件，具体看下方。

需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

**一、AIGC所有方向的学习路线**

AIGC所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了，安装就可直接上手！
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。