Stable Diffusion绘画 | 来训练属于自己的模型:素材处理与打标篇

纵观整个模型训练流程,图片素材准备和打标环节占据的分量比重,绝对超过60%。

上一篇分享了图片素材准备,这一篇,开始对准备好的图片素材进行处理了。

素材处理

我已经收集了 霉霉 的25张图片:

但是,发现一个问题,图片的长宽比例没有统一。

我们来到:https://www.birme.net/ 对图片进行裁剪。

上传准备好的图片:

手动调整需要裁剪的范围:

在这里插入图片描述

调整后,点击下载压缩包:

在这里插入图片描述

得到宽高比例一致的图片素材:

素材打标

打标可使用的工具,较为推荐的是「朱尼酱」和一众热心用户共同开发的开源炼丹软件-cybertronfurnace1.4(仅限Windows系统使用)

下载地址:https://pan.quark.cn/s/7160111f893a#/list/share

玩车下载后解压缩,双击 cybertronfurnace1.4\cfurnace_ui\Cybertron Furnace.exe 即可启动。

在这里插入图片描述

第一次启动需要加载一些软件必须的部件,加载完毕后,就可以开始炼丹了:

在这里插入图片描述

填写触发词:1woman, Taylor_Swift,再把上一步裁剪好的素材上传:

在这里插入图片描述

在上传素材页面,因为图片已经裁剪好,分辨率选择 512*512,模式选择 无需裁剪,TAG 保持默认的 0.35

TAG(打标阈值)推荐0.35以上,

阈值过小:会生成冗余的提示词

阈值过大:提示词很少

点击「预处理」,软件就会自动在后台对图片进行裁剪和打标处理:

在这里插入图片描述

训练结束后,打开「训练集」会有2个文件夹(勾选了「脸部加强训练」):

  • 专门脸部特写的图片
  • 正常裁剪的图片

接着,点击「打开训练集」:

就能看到已经完成预处理的训练集文件夹:

来到以下的文件夹中,就能看到图片以及对应的打标文件:
在这里插入图片描述
在这里插入图片描述

今天先分享到这里~


开启实践:SD绘画 | 为你所做的学习过滤

要使用stable diffusion训练出自己专属的人像模型,需要按照以下步骤进行操作: 1. 数据收集:首先,需要收集足够数量和多样性的人像图片,这些图片应该包括各种不同的表情、角度和光照条件。这些图片将作为训练数据来训练模型。 2. 数据预处理:对收集到的数据进行预处理,包括裁剪、调整大小和格式转换等。确保所有的图片在输入到模型之前具有相同的尺寸和格式。 3. 网络架构设计:根据需要训练的人像模型来设计网络架构。可以选择使用现有的深度学习网络架构,如ResNet或VGG等,也可以自定义网络架构。这个网络将用于提取人像图片的特征。 4. 模型训练:使用稳定扩散(stable diffusion)方法训练模型。稳定扩散是一种用于生成对抗网络(GAN)的训练方法,通过在生成器(生成人像)和判别器(判断生成的图片是否为真实人像)之间进行迭代训练来提高生成的效果。 5. 优化与调参:在训练过程中,需要进行优化和调参,以提高模型的准确性和生成人像的质量。可以尝试不同的学习率、批量大小和训练迭代次数等参数,以找到最佳的配置。 6. 模型评估:在完成模型训练后,需要对生成的人像进行评估。可以使用一些评估指标,如峰值信噪比(PSNR)和结构相似度指标(SSIM),来评估生成的人像与真实人像之间的相似度。 7. 继续优化:如果评估结果不理想,可以根据需要进行进一步的优化。这可能包括增加训练数据的数量、改进网络架构或调整参数等。 通过以上步骤,就可以使用stable diffusion方法训练出自己专属的人像模型。这个人像模型可以用于生成逼真的人像,应用于各种创作和设计领域。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肖遥Janic

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值