吉卜力动画风格图像生成:Ghibli Diffusion

在这里插入图片描述
注:本图来自官方

开源公告:Ghibli Diffusion模型发布

一、模型简介

Ghibli Diffusion模型正式开源!这是一个经过精细微调的Stable Diffusion模型,它基于吉卜力工作室(Studio Ghibli)现代动画长片的图像进行训练。通过在提示词中加入“ghibli style”,用户能够生成具有吉卜力风格的独特图像。

二、模型应用示例

(一)多样化的渲染内容

该模型可以渲染出各种风格的图像,包括角色、汽车、动物和风景等。例如,有美丽的加勒比海滩热带日落景观,以及冰原、白色山脉、北极光和星空等带有低地平线的北方景色。在生成这些图像时,还可设置负向提示词,如“soft blurry”,以避免生成模糊的图像。

(二)特定对象的生成示例

风暴兵(Storm Trooper):使用“ghibli style (storm trooper)”作为提示词,负向提示词为“(bad anatomy)”,并设置步数为20、采样器为DPM++ 2M Karras、CFG比例为7、种子数为3450349066、尺寸为512x704,即可生成具有吉卜力风格的风暴兵图像。
大众甲壳虫(VW Beetle):提示词为“ghibli style VW beetle”,负向提示词设为“soft blurry”,步数30、采样器为Euler a、CFG比例为7、种子数为1529856912、尺寸为704x512,能生成吉卜力风格的大众甲壳虫图像。

三、模型训练细节

此模型由ShivamShrirao采用基于diffusers的DreamBooth训练方法,结合先验保留损失(prior - preservation loss)和训练文本编码器标志(train - text - encoder flag),经过15000步训练而成。

四、使用方法

Ghibli Diffusion模型的使用方式与其他Stable Diffusion模型相同。以下是一个简单的Python代码示例,展示如何使用该模型生成图像:

from diffusers import StableDiffusionPipeline 
import torch 
 
model_id = "nitrosocke/Ghibli-Diffusion" 
pipe = StableDiffusionPipeline.from_pretrained(model_id,  torch_dtype = torch.float16)  
pipe = pipe.to("cuda")  
 
prompt = "ghibli style magical princess with golden hair" 
image = pipe(prompt).images[0] 
 
image.save("./magical_princess.png")  

五、模型扩展

该模型支持导出为ONNX、MPS和/或FLAX/JAX格式,方便用户在不同的环境和应用中使用。

六、支持与反馈

让我们一起利用Ghibli Diffusion模型,开启充满创意的图像生成之旅!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Open-source-AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值