SDXL_LORA模型训练详细教程

最新推荐文章于 2025-05-07 11:19:58 发布

海神之光.

最新推荐文章于 2025-05-07 11:19:58 发布

阅读量6.3k

点赞数 9

分类专栏：大模型文章标签：人工智能

本文链接：https://blog.csdn.net/FL1768317420/article/details/137463598

版权

大模型专栏收录该内容

6 篇文章

订阅专栏

本文转自：SDXL_LORA模型训练详细教程（含云端教程） - 知乎

一、前言

之前写过一篇SD1.5 LORA模型的炼制方法，有的人想要我详细点说说秋叶启动器的lora训练器，SDXL建议使用秋叶的训练器，SD1.5赛博丹炉，个人习惯仅供参考！这次基于sdxl_lora模型的训练，顺便给大家详细的讲讲训练过程。SD1.5_lora训练文章链接

最新版秋叶一键安装包：

链接：https://pan.quark.cn/s/024e082b37dc

二、安装使用

还是和以前一样，解压后先更新，后启动。(这是之前的图，不用在意）

启动后来到如下界面，点击专家模式开始

sd_lora则是和以前一样，所以模型种类选择sdxl_lora，底模文件路径可以选择base这种祖宗级的模型，也可以选择一个你喜欢的SDXL模型作为底模（最好与你的训练数据风格相近），推荐第二种。

数据集裁剪打标签和放在什么地方，底模放置路径，看上次的lora训练教程，很简单。教程

我补充一点，训练集复制到该目录下，20是repeat数，你的每张图片要重复训练多少次，把这个数字改成几。动漫人物推荐10，真人推荐20-30，实物建筑30往上。

来到数据集设置，训练集在train目录下，正则化默认为空。作用是防止过拟合，如果你要使用，新建一个目录放置你的正则化图像，然后把路径填上【正则化图像就是基于你的底膜生成的图片，假如你要训练一个女孩lora，那就在你的底模只使用1girl生成20张图像，放在正则化目录下】；训练分辨率通常为1024x1024，如果本地训练显存不够，可以适当减小为768x1024，必须是64的倍数。默认开启 ARB 桶，以允许使用非固定宽高比的图像来训练（简单来说就是不需要手动剪裁了）。ARB 桶在一定程度上会增加训练时间。 ARB桶分辨率必须大于训练分辨率，照抄就行。

模型名称自己命名，保存精度选bf16,bf16 可表示的整数范围更广泛，但是尾数精度较小；fp16 表示整数范围较小，但是尾数精度较高，其他默认。

最大训练轮数，建议10-15，基本能收敛基本也就在这区间，不能加大也没有；批量大小根据自己显卡来，12g往上可以加大，爆显存就往下调小，batch size越多大，模型的泛化性越好；梯度累加步数可以理解为变相加大batch size的一种方法，假如你的batch size为2，梯度累加步数为2，那么模型一次输入两张图片进行训练，训练完后并不更新参数，等到又输入1个batch2张图片训练完成后才更新参数，就变相等于训练4张图片进行更新一次参数，当然只是显存不够的无奈之举。