Stable Cascade-ComfyUI中文生图、图生图、多图融合基础工作流分享

最近 ComfyUI对于Stable Cascade的支持越来越好了一些,官方也放出来一些工作流供参考。

这里简单分享几个比较常用的基础工作流。

(如果还没有下载模型,可以先阅读上一篇Stable Cascade升级,现在只需要两个模型

🌋文生图

StageC阶段:

首先是使用基础的模型加载节点,把stage_c模型加载进来,然后正常输入正向提示词和负向提示词,稍微需要注意的是采样里边的参数和latentimage生成节点要使用StableCascade_EmptyLatentImage,这里边的42,指的是1024分辨率需要压缩42倍率去生成一个小的latent,用于后续Stage_c模型继续采样;

StageB阶段:

将第一步生成的latent进行二次采样和放大;这里需要将StageC阶段的condition和stageC生成的latent作为控制条件进行输入,然后继续在空白噪声上进行采样;

最后通过VAE,也就是之前提到的三段式里边的StageA,将图像从潜空间还原为像素空间,就生成图像了,这里的VAE是从StageB的模型中直接调取的。

测试用的提示词为:A fashionably dressed anthropomorphic cat struts down the runway,3d,disney studio,cartoon,cute,

🚠图生图

输入图像为:

提示词为:super man, close-up, walking in the desert, oasis in the background, nighttime, with a moon in the sky,

输出图像为:

效果部分,可以看到会参考输入图像画风和构图,并将画面主体根据提示词做了替换。

图生图部分,比较特别的是stabelcascade_stageC_vaeencode这个节点,通过这个节点将像素空间的图像转化为潜空间,类似之前的vae encoder,只是这里要将输出的latent分别发给stageC阶段的采样器和StageB阶段的采样器,另外,StageC阶段的采样器,降噪不要太高,0.6左右比较合适,否则就跟图像关系不大了。

🚀多图融合

 提示词留空,输入图像为两张,分别是:

 输出图像为:

嗯,水母被巧妙的放在海边的盒子中了,语义上是合理的。

CLIP Vision Encode节点可用于加载特定的CLIP视觉模型,类似于CLIP模型用于对文本提示进行编码,CLIP视觉模型用于对图像进行编码。

注意这里的图片是可以多级串联的,只是串联的太多,每张图片的影响力理论上也会降低。

🎈工作流地址:

comfyui官方示例:Stable Cascade Examples | ComfyUI_examples

当然你也可以到网盘下载:https://pan.quark.cn/s/9b155ffd02ca

🎉写在最后~

去年的时候写了两门比较基础的Stable Diffuison WebUI的基础文字课程,大家如果喜欢的话,可以按需购买,在这里首先感谢各位老板的支持和厚爱~

✨StableDiffusion系统基础课(适合啥也不会的朋友,但是得有块Nvidia显卡):

https://blog.csdn.net/jumengxiaoketang/category_12477471.html

​​🎆综合案例课程(适合有一点基础的朋友):

https://blog.csdn.net/jumengxiaoketang/category_12526584.html

​​

这里是聚梦小课堂,就算不买课也没关系,点个关注,交个朋友😄

Cascade R-CNN是一种用于目标检测的深度学习结构,通过级联多个R-CNN模块来提高检测的准确性和鲁棒性。 Cascade R-CNN结构由三个主要部分组成:基础网络、R-CNN模块和级联结构。 基础网络通常采用卷积神经网络(CNN),用于提取像的特征。常见的基础网络有ResNet、VGG等。基础网络负责将原始像输入,并逐层提取出高层次的特征,以供后续处理使用。 R-CNN模块是Cascade R-CNN的核心部分。它由若干个R-CNN模块级联而成,每个R-CNN模块通过一个CNN来进行特征提取,然后通过一个ROI Pooling层提取出感兴趣区域(Region of Interest)的特征。接着,这些特征经过全连接层,进行目标分类和边界框回归。 级联结构是Cascade R-CNN的独特之处。它通过级联多个R-CNN模块来逐步提高目标检测的准确性。级联结构的每个阶段都会选择性地引入难例样本,以便让模型更好地学习难以区分的目标。级联结构通常包括三个阶段,每个阶段从不同的阈值划分正负样本,通过进一步训练来提高检测的精度和召回率。 总结起来,Cascade R-CNN的结构展示了一个多阶段的目标检测系统。它通过级联多个R-CNN模块,逐步提高检测的准确性和鲁棒性。基础网络用于特征提取,R-CNN模块用于目标分类和边界框回归,级联结构用于引入难例样本并提高检测性能。这种结构在目标检测领域取得了显著的性能提升。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

聚梦小课堂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值