Datawhale X 魔搭AI夏令营 Task 3笔记

用工作流平台ComfyUI来完成文生图

1.concept 

   GUI是“Graphical User Interface”(图形用户界面)的缩写。简单来说,一种让用户通过直观的图形和视觉元素如按钮、图标和菜单来与电子设备交互的界面,能够极大地简化了操作复杂度并提升了用户体验。

  ComfyUI是GUI的一种,主要用于操作图像的生成技术。ComfyUI 的特别之处在于它采用了一种模块化的设计,把图像生成的过程分解成了许多小的步骤,每个步骤都是一个节点。这些节点可以连接起来形成一个工作流程,这样用户就可以根据需要定制自己的图像生成过程。
 

2.ComfyUI核心模块 

 1.2.1CheckpointLoader模型加载器,用于加载基础的模型文件


1.2.2CLIP,将文本类型的输入变为模型可以理解的latent space embedding作为模型的输入。
     What is “latent space embedding”(潜在空间嵌入)?一种在数据处理和机器学习中常见的技术,主要用于将复杂、高纬度的数据转换成简单、低纬度的数据,便于数据的整理和分析。通过这种方式,我们可以更容易地进行数据分析、可视化和其他处理任务,尤其是在处理图像、语音或文本这类复杂数据时。


1.2.3VAE解码器,将latent space中的embedding解码为像素级别的图像。


1.2.4采样器,用于控制模型生成图像,不同的采样取值会影响最终输出图像的质量和多样性。采样器可以调节生成过程的速度和质量之间的平衡。

  想象Stable Diffusion就像是一个魔术师,它能够将一张满是随机噪点的“噪声图”变成一张清晰的图片,比如一张漂亮的风景画或者一个人物肖像。这个变化过程称为“降噪”,就是逐渐去除这些噪点,让图片从混乱变得清晰。

在这个魔术过程中,有几个关键的设置:

  1. seed(种子):这就像是魔术的起始点。种子是一个数字,用来控制噪声图的初始模样。改变种子,噪声图也会改变,从而影响最终的图片。

  2. control_after_generate(生成后控制):每次魔术完成后,你可以选择是否改变种子,这样下一次的魔术会有新的起点。

  3. steps(步骤):这是降噪的过程中需要重复多少次“魔法”,每多一次,图片就会更清晰,但也需要更多的时间。

  4. cfg(分类器自由引导):这个设置决定了你给魔术师的指示(prompt)对最终图片的影响有多大。数值越高,最终的图片越忠实于你的描述。

  5. denoise(去噪力度):这决定了在降噪过程中会保留多少原始内容,即多少噪声会被清除。

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值