自己动手,丰衣足食,自己从头到尾搭建一个工作流,才是真正掌握ComfyUI精髓的王道。我们马上开始吧!
一、明确目标,分析问题
在动手之前,我们需要先明确自己的需求和目标,这也是完成一个工作流搭建的首要步骤。假设我现在要做一个露营活动海报,我手头有这样一张图片,但我想要的表现形式是手绘风格人物与真实户外场景相结合。
那么我要解决的问题便是:
-
抠出人像。
-
针对人像做局部重绘,使其转绘成手绘风。
二、探索实现目标的路径
明确了目标之后,就开始研究有哪些路径可以实现,从而选择效果更好或效率更高的方式。
抠出人像,我们有几种选择:
-
使用Photoshop等软件抠图,再上传图片蒙版。
-
在ComfyUI局部重绘蒙版编辑器里直接绘制。
当然,还有更智能的选择,比如使用ComfyUI里的智能抠图节点,SAM+Grounding DINO的组合。
Grounding DINO能够根据用户输入的文本描述检测图像中的物体,生成一个大致的区域范围,而SAM(Segment Anything Model)可以在这个区域里做更仔细的分割,把物体抠出来并生成相应的蒙版。
现在,我把图片加载上去,然后描述要抠的是坐着的这位美女,很快就可以得到抠出以后的人像和对应的蒙版信息了。
至于手绘风格,我们也有多种方法:
-
直接使用手绘风格的Checkpoint大模型。
-
通过lora实现风格化。
-
使用IP-Adapter,借助参考图来塑造风格。
别忘了,重绘人物时加上ControlNet来保持人物的关键特征,而选用哪种Controlnet更合适呢?这也是需要你不断尝试的。
在尝试不同方法的时候,我们可以灵活选用不同的操作界面。比如在WebUI里测试不同模型的效果,毕竟在工作流搭建完成前,WebUI操作起来更方便。
三、逐步构建工作流
准备工作做完了,现在我们来搭建工作流。
我的建议是:化整为零,先完成再完美。想象我们在用积木搭一只巨型猛兽,我们暂时还不清楚它的整体身形,但是可以先把它的头部、四肢、身体、尾巴等核心部位一一搭出来,然后再逐步拼接,渐次成型。
具体步骤如下:
1.添加核心节点。
在ComfyUI的界面上,我们先把每个环节的核心节点添加上:
-
Load Image(加载图像)
-
Load Checkpoint和Load Lora(大模型加载器、Lora加载器)
-
G-Dino+SAM Segment(智能抠图节点)
-
Set Latent Noise Mask(设置Latent噪波遮罩)
-
Controlnet
-
KSampler(K采样器)
-
CLIP Text Encode(文本编码器)
-
Save Image(保存图片)
2.连接核心节点
连接节点时,我们可以采用“顺序连接、逆向倒推、输入点填满”三种思路。
顺序连接:
从最开始的只有一侧端口的节点出发,去思考有哪些地方会跟它产生直接的联系?
与图像加载器产生直接联系的地方有抠图节点、局部重绘、ControlNet。所以从“Load Image”出发的路径有:
模型加载器,在这个工作流里只有K采样器,它的连接路径就是:
顺序连接的思路,可以迅速串联起已经添加进来的大部分主要功能节点。
逆向倒推:
与此同时,你还可以以一种倒推的思路来连线,并在此过程中对核心节点查漏补缺。
比如KSampler,输入端口“条件”,可以逆向连接到ControlNet输出的条件。而ControlNet的条件是和文本编码器读取的提示词条件汇集在一起的,所以它的前面又可以连到文本编码器。文本编码器的Clip直接连回模型加载器。
保存图片的节点,添加一个解码器,倒着接回到KSampler。
输入点填满:
一般情况下,所有节点的输入端口都必须被填满(少量拥有多个功能分支的复杂节点除外)才能正常工作。所以到最后,我们检查看看还有哪些节点的输入没被连上的。
不知不觉间,工作流的核心部分就已经全部串联起来了。
3.补充与完善
经过前面的步骤,一个工作流的大体框架已经搭建出来了。接下来就是完善工作流,比如添加一些调节参数类型的节点:
Tagger反推提示词节点,这样不用每张图片都亲自填写提示词。
Resize Image节点,自动调整图片尺寸,提高工作流效率。
另外,还可以在抠图节点和ControlNet后面添加Preview Image(预览图片)节点,以检查阶段输入结果是否合理。
4.测试与优化
首先测试工作流是否能正常运转,如果前面的操作都到位,这一步应该没什么问题。然后,我们就可以微调各项参数,比如抠图的阈值、lora权重、ControlNet权重、重绘幅度等,找到最佳配置。建议多换几张不同规格/形式的图片,检查是否能稳定输出符合要求的结果。
5.整理工作流
强迫症患者可能会很喜欢这一步。刚完成的工作流界面是这样:
如果只是自己使用,那问题不大。但如果需要分享出去,可就得花时间整理一下了,否则这杂乱无章的节点和连线容易令人抓狂。
首先,把同一功能的节点归在一起,然后上下左右对齐,调节大小,统一颜色。还可以编组,并添加使用标注。对于不再需要修改内容的节点,可以点击左上角的圆点将其隐藏。
好了,整理好的界面是这样的,是不是比刚刚的整齐多了?
今天聊的工作流搭建思路就到这里啦。如果你觉得我的分享对你有帮助,或者你想了解更多相关技巧,那就别忘了点个关注哦!期待下次还能和你在这里相遇!
写在最后
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。