diffusers 文成图AIGC常见pipeline参数介绍

loong_XL

已于 2024-05-06 12:04:56 修改

阅读量744

点赞数 9

分类专栏：深度学习多模态文章标签： AIGC ai AI作画

于 2024-01-11 10:36:15 首次发布

本文链接：https://blog.csdn.net/weixin_42357472/article/details/135520142

版权

深度学习同时被 2 个专栏收录

该专栏为热销专栏榜第56名

277 篇文章 144 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

多模态

38 篇文章 2 订阅

订阅专栏

本文介绍了Diffusers库在生成图像中的关键参数，包括pipeline的主要参数如prompt、height、width、num_inference_steps和guidance_scale，以及模型加载时的随机种子generator和negative_prompt。指导比例guidance_scale影响图像与文本的相关性，而采样步数num_inference_steps则影响生成效果。此外，还提到了negative_prompt用于排除的内容和num_images_per_prompt设定的每次生成图片数量。

摘要由CSDN通过智能技术生成

参考：
https://blog.csdn.net/m0_54105644/article/details/134290762

Diffusers是用于生成图像，音频甚至分子3D结构的最先进的扩散模型的首选库。无论是寻找简单的推理解决方案还是训练自己的扩散模型，Diffusers都是一个支持两者的模块化工具箱。该library 的设计侧重于性能，简单的简单性和对抽象的可定制性。
Diffusers提供了三个核心组件：

1、Pipelines: 高层类，以一种用户友好的方式，基于流行的扩散模型快速生成样本
2、Models：训练新扩散模型的流行架构，如UNet
3、Schedulers：推理场景下基于噪声采样生成图像或训练场景下基于噪声生成带噪图像的各种技术

1、pipeline主要参数

其中常用的：
prompt: 正面提示词
height、width：生成图像的高和宽
num_inference_steps: 采样步数
guidance_scale: 文字相关度，这个值越高，生成的图像就跟文本内容越贴近（但不是越大越好，越大生成出来的质量很差）
negative_prompt: 负面提示词
num_images_per_prompt: 每次