diffusers 文成图AIGC常见pipeline参数介绍

本文介绍了Diffusers库在生成图像中的关键参数,包括pipeline的主要参数如prompt、height、width、num_inference_steps和guidance_scale,以及模型加载时的随机种子generator和negative_prompt。指导比例guidance_scale影响图像与文本的相关性,而采样步数num_inference_steps则影响生成效果。此外,还提到了negative_prompt用于排除的内容和num_images_per_prompt设定的每次生成图片数量。
摘要由CSDN通过智能技术生成

参考:
https://blog.csdn.net/m0_54105644/article/details/134290762

Diffusers是用于生成图像,音频甚至分子3D结构的最先进的扩散模型的首选库。无论是寻找简单的推理解决方案还是训练自己的扩散模型,Diffusers都是一个支持两者的模块化工具箱。该library 的设计侧重于性能,简单的简单性和对抽象的可定制性。
Diffusers提供了三个核心组件:

1、Pipelines: 高层类,以一种用户友好的方式,基于流行的扩散模型快速生成样本
2、Models:训练新扩散模型的流行架构,如UNet
3、Schedulers:推理场景下基于噪声采样生成图像或训练场景下基于噪声生成带噪图像的各种技术

1、pipeline主要参数

其中常用的:
prompt: 正面提示词
height、width:生成图像的高和宽
num_inference_steps: 采样步数
guidance_scale: 文字相关度,这个值越高,生成的图像就跟文本内容越贴近(但不是越大越好,越大生成出来的质量很差)
negative_prompt: 负面提示词
num_images_per_prompt: 每次

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

loong_XL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值