仅需6G显存！腾讯混元-Di v1.2 SD WebUI 玩起来~中文提示词生图他不爽么！

AI绘画小33

已于 2024-07-30 10:27:39 修改

阅读量424

点赞数 16

文章标签： stable diffusion 人工智能 AIGC

于 2024-07-30 10:27:23 首次发布

本文链接：https://blog.csdn.net/2401_84760527/article/details/140790111

版权

前言

模型简介

本月腾讯混元DiT模型已升级至1.2版本，并推出小显存版本与Kohya训练界面，进一步降低使用门槛的同时提升图片质量，最低仅需6G显存即可运行优化推理框架。

作为首个中文原生DiT开源模型，混元DiT自全面开源以来，一直持续建设生态。6月，混元DiT发布的专属加速库，可将推理效率进一步提升，生图时间缩短75%；并进一步开源了推理代码；发布LoRA和ControlNet等插件。于此同时，模型易用性大幅提升，用户可以通过Hugging Face Diffusers快讯调用混元DiT模型及其插件，或基于Kohya和ComfyUI等图形化界面训练与使用混元DiT。

中英双语DIT架构

Hunyuan-DiT 是潜在空间中的扩散模型，如下图所示。根据潜在扩散模型，使用预训练的变分自动编码器 (VAE) 将图像压缩到低维潜在空间，并训练扩散模型以使用扩散模型学习数据分布。扩散模型使用转换器进行参数化。为了对文本提示进行编码，利用预训练的双语（英语和中文）CLIP 和多语言 T5 编码器的组合。

如此受欢迎的国产大模型，小33也是想起来尝试下。我们先来看看在Stable Diffusion Web UI中如何部署使用混元DiT模型。

Web UI模型扩展安装

WebUI扩展安装：

通过复制 git 存储库，通过 webui 扩展下载器安装此扩展当然这里也可以自己选择手动下载安装。安装完记得重启哦！所有的AI设计工具，模型和插件，都已经整理好了，👇获取~

将HunyuanDiT模型从Huggingface下载到本地，默认存储位置在models/hunyuan （没有自己手动新建）webui文件夹中。

下载地址：

https://huggingface.co/Tencent-Hunyuan/HunyuanDiT-v1.2-Diffusers/tree/main

**注意：**这里直接克隆下来后，名称需要修改为hunyuan，另外需要将 transformer 模型放在中models/Stable-Diffusion。当然你也可以通过上面的lib混元DiT模型地址下载。

另外需要提醒的是，在根据官方操作指南进行本地部署时，如果出现了IndexError: too many indices for tensor of dimension 3异常，那应该是你开启了Hunyuan DiT选项卡，可以进行关闭。

如果以上感觉下载很繁琐，没关系，老徐文末放置了整理好的网盘链接，可以直接获取。

好了，上述操作准备完成后，我们回到WebUI界面，开始我们的体验之旅吧。

效果展示

1.柔光，美丽的透明冰雕女孩，发光纹身，冰雕，高品质，杰作，32K，封面艺术，惊人的构图，（美丽和审美：1.20），极其细致，黑底，荧光，渐变，光，流动，轮廓光，超现实艺术，溶解和消失为粒子，半透明荧光，发光粒子，光学耀斑，

2.一位性感亚洲美女,短发，露肩，长裙，中胸，变焦，高质量，电影，城市夜景，远景

3.人像摄影,最佳品质,大作,时尚摄影,一个亚洲美女,她有一头又长又直的棕色头发，戴着一条白色缎带。她带着温柔的微笑，涂着一支浅粉色的口红。她穿着浅色上衣，脖子上系着一条白色大丝带。她怀里抱着一只毛绒泰迪熊，上面系着一条相配的丝带。背景柔和模糊，突出了主题，背景中有一丝木制家具的味道。

4.日本动漫风格，在旋转的星空下，左边的女孩穿着白色连衣裙，举起左手，而右边的男孩穿着衬衫，举起右手。他们的十个手指互相碰了碰，右边的男孩比女孩高。一盏灯出现在他们触摸的手上，湖，他们的倒影

4.1girl,keq1girl,keqing (genshin impact),keqing (opulent splendor) (genshin impact),by modare, genshin impact,close up,upper body,multicolored dress,official alternate costume,pink eyes,bow choker,single earring,double bun,cone hair bun,purple hair,bare shoulders,long hair,hair ornament,sidelocks,strapless dress,cleavage,hair ribbon,simple background,twintails,blush,two-tone dress,absurdres,highres,newest,sensitive,masterpiece,

模型及生成信息参考

小33生图参数：

**大模型：**腾讯混元-DiTv1.2

**分辨率：**768*1024

**采样方法 (Sampler)：**DPM++2M SDE karrs

**迭代步数 (Steps)：**35

**提示词引导系数 (CFG Scale)：**7

**逆向提示词：**错误的眼睛,糟糕的人脸,disfigured,糟糕的艺术,变形,多Q余的肢体,模糊的颜色,blurry,重复,病态,残缺,watermark,

好了今天的分享就到这里了，也欢迎随时和小33交流。

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好，需要的点击下方插件，即可前往免费领取！

在这里插入图片描述

AI绘画小33

关注

16
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
仅需6G显存！腾讯混元-Di v1.2 SD WebUI 玩起来~中文提示词生图他不爽么！

模型简介本月腾讯混元DiT模型已升级至1.2版本，并推出小显存版本与Kohya训练界面，进一步降低使用门槛的同时提升图片质量，最低仅需6G显存即可运行优化推理框架。作为首个中文原生DiT开源模型，混元DiT自全面开源以来，一直持续建设生态。6月，混元DiT发布的专属加速库，可将推理效率进一步提升，生图时间缩短75%；并进一步开源了推理代码；发布LoRA和ControlNet等插件。
复制链接

扫一扫