阿里最新开源中文文生图模型-秒笔，与SD1.5同结构，兼容lora、controlnet等主流插件

最新推荐文章于 2025-03-04 15:42:00 发布

AIGC Studio

最新推荐文章于 2025-03-04 15:42:00 发布

阅读量1.2k

点赞数 7

分类专栏： AIGC 深度学习文章标签：人工智能 AIGC 图像生成计算机视觉 stable diffusion

本文链接：https://blog.csdn.net/xs1997/article/details/136711203

版权

深度学习同时被 2 个专栏收录

328 篇文章

订阅专栏

AIGC

318 篇文章

订阅专栏

今天向大家介绍阿里刚开源的一个中文文生图模型-妙笔，与经典的stable-diffusion 1.5版本拥有一致的结构，兼容现有的lora，controlnet，T2I-Adapter等主流插件及其权重。

秒笔直接输入中文就可以完成文生图操作，使用起来非常便捷，生图的效果也十分逼真。

比如输入“枯藤老树昏鸦，小桥流水人家。水墨画。”来看秒笔生成结果。可以看出秒笔很好的表达出来诗句中的意思并生成了诗中的内容。

再比如输入“极具真实感的复杂农村的老人肖像，黑白。”

可以看出生成的人像具有很好的完整性和真实感，以往生图模型在生成人像方面的缺点在这也都完成的很好。

项目地址

https://github.com/ShineChen1024/MiaoBi

安装运行

1.克隆项目

git clone https://github.com/ShineChen1024/MiaoBi.git

2.创建虚拟环境并安装所需要的包

conda create -n MiaoBi-SD python==3.10
conda activate MiaoBi-SD
pip install torch==2.0.1 torchvision==0.15.2 numpy==1.25.1 diffusers==0.25.1 opencv-python==4.8.0  transformers==4.31.0 accelerate==0.21.0

3.下载模型

从Huggingface下载权重，并把它放在检查点文件夹。

MiaoBi checkpoints下载链接

Diffuser使用

from diffusers import StableDiffusionPipeline
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("checkpoints/miaobi_beta0.9/tokenizer",  trust_remote_code=True)
pipe = StableDiffusionPipeline.from_pretrained("checkpoints/miaobi_beta0.9")

pipe.to("cuda")
prompt = "一只穿着铠甲的猫"
image = pipe(prompt).images[0]
image.save("铠甲猫.png")