【从零到一AIGC源码解析系列1】文本生成图片Stable Diffusion的diffusers实现
Stable Diffusion是由CompVis、StabilityAl和LAION的研究人员和工程师创建的文本到图像潜在扩散模型。它使用来自LAION-5B数据库子集的512x512图像进行训练。该模型使用冻结的CLIPViT-L/14文本编码器,并根据文本提示词来控制模型生成图片。该模型具有860M参数的UNet和123M参数文本编码器,相对轻量级,可以在许多消费级GPU上运行。*注:本文结合diffusers库来实现。
原创
2024-01-20 15:34:38 ·
580 阅读 ·
0 评论