实践教程｜StableDiffusion图像生成能力一探！附Int8量化教程与ONNX导出推理

最新推荐文章于 2024-07-05 11:05:36 发布

机器学习与AI生成创作

最新推荐文章于 2024-07-05 11:05:36 发布

阅读量2.7k

点赞数 2

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5MTgzNzE0MA==&mid=2247497914&idx=2&sn=43940b5276b2a25d561e436974d3c89d&chksm=fe2a5a01c95dd317a5b7bc9a4fd6cc53ed4895bb1def0775d4f727117871a9bbd4e60137241e&scene=126&&sessionid=0

版权

作者丨林大佬@知乎编辑丨极市平台

来源丨https://zhuanlan.zhihu.com/p/561181890

最近stablediffusion大火，但很多人都只是吃瓜，最多也就是在huggingface网站上试一下，这其实并不够，作为一个富有商业嗅觉的AI从业者，我嗅探到的更多的是他的商业能力，不得不说，现在生成类的AI模型，已经越来越来接近甚至超越人类水平。

今天就来一探究竟，看看StableFusion到底能做啥？并附上这个超级大模型的int8量化教程，以及ONNX导出，甚至是TensorRT加速推理。

请注意，一下的所有测试案例，都是我用CPU跑出来的，你要问我多慢？通过CPU OpenVINO加速也就3分钟推理。为什么不用GPU？因为显存不足！

好在我们用CPU也能比较完善的推理，结果并不差。未来我们还会继续使用TensorRT推理，加速整个推理流程。更进一步的将StableDiffusion变成生产力工具！

代码

这次我们直接先上代码，这里面包含了CPU下推理StableDiffusion，以及OpenVINO加速的代码，同时，也包含了量化脚本，感觉兴趣的可以再github提issue。

git clone https://github.com/luohao123/gaintmodels

备注：代码来自大佬，不是本人写的。不过有问题欢迎提问交流。

测试StableDiffusion

来看看生成的效果，由于模型只能编码英文，我们就以英文作为promopt。

A green car with appearance of Tesla Model 3 and Porsche 911

这长得还真的就像是，保时捷和model3的合体！中间那个logo你注意看，感觉并不是特斯拉的logo！有点像保时捷的logo！~

A robot Elon Musk in cyberpunk, driving on a Tesla Model X

ModelX倒是有点像，但是马斯克人呢？？

StableDiffusion这类模型，似乎在生成风景画上表现不错

A beautiful mansion beside a lake in the woods, with a clean road front of it.

一栋湖边的别墅

A beautiful castle beside a waterfall in the woods, detailed, 4k

瀑布旁边的城堡

真的是非常的优美！而且细节清晰可见！！

接下来我们测试一下，一些NSFW的内容，请注意，高能预警，我们的模型把huggingface的SaftyChecker去掉了，为什么？因为我们并不需要！并且这个模块是会占用很多内存的！

A beautiful sexy girl with red hair, 4k, detailed, without any cloth.

由于你懂得原因，我只截取了一部分！！但是，这个生成的效果真的令人震惊！过于真实！！

再来测试一些创造性的东西：

A advanced spaceship with Elon Musk driving on it, detailed, in reality style

这个非常设计的，地区非常的逼真！看这个反光，这个倒影，以及上面的mount，甚至有种自动驾驶飞船的感觉。

A red tv in front of sofa, a child is looking at it with a dog.

在比如这个图片，这个真实度简直超乎了我的预料，电视机里面甚至还可以看到倒影！！

代码讲解

Experiements on testing GaintModels such as GPT3, StableFusion. We offer TensorRT && Int8 quantization on those gaint models. Make you can inference on a 6GB below GPU mem card!

Install

Some requirements to install:

pip install diffusers
pip install transformers
pip install alfred-py

Models

StableFusion:

First, we need download stablefusion weights from hugging face.

git clone https://huggingface.co/CompVis/stable-diffusion-v1-4
git lfs install
cd stable-diffusion-v1-4
git lfs pull

You should downloading weights using git lfs large file system, the model about 3GB.

To make unet_2d_condition in stablefusion able to export to onnx, make some modification on diffusers, following: link

file: diffuers/models/unet_2d_conditions.py

# L137
timesteps = timesteps.broadcast_to(sample.shape[0])
#timesteps = timesteps.broadcast_to(sample.shape[0])
timesteps = timesteps * torch.ones(sample.shape[0])

output = {"sample": sample}
#output = {"sample": sample}

return output
return sample

After that, move stable-diffusion-v1-4 to weights folder. Run:

python export_df_onnx.py

To generate onnx models.

总结

生成模型在之前效果其实并不好，但是到如今，大模型已经展示出了惊人的能力。不管是创作还是设计logo，从某种方面来说可能甚至是超过常人的。然而大模型都非常大，门槛比较高，我们将StableDiffusion 降维到int8，你甚至只需要一个CPU就能推理！

这里面还有无数种可能等待大家来探索，欢迎关注、点赞文章，更多教程更新中。

猜您喜欢：

戳我，查看GAN的系列专辑~！

一顿午饭外卖，成为CV视觉前沿弄潮儿！

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

ICCV 2021 | 35个主题GAN论文汇总

超110篇！CVPR 2021最全GAN论文梳理

超100篇！CVPR 2020最全GAN论文梳理

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

机器学习与AI生成创作

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
实践教程｜StableDiffusion图像生成能力一探！附Int8量化教程与ONNX导出推理

作者丨林大佬@知乎编辑丨极市平台来源丨https://zhuanlan.zhihu.com/p/561181890最近stablediffusion大火，但很多人都只是吃瓜，最多也就是在huggingface网站上试一下，这其实并不够，作为一个富有商业嗅觉的AI从业者，我嗅探到的更多的是他的商业能力，不得不说，现在生成类的AI模型，已经越来越来接近甚至超越人类水平。今天就来一探究竟，看看Sta...
复制链接

扫一扫