【转载】stable diffusion 真人照片训练PT实操

本文详细介绍了如何通过stablediffusion利用深度学习技术,从网络抓取的原始照片中生成高质量的人像或特定画风照片,涉及数据清洗、预处理、模型训练和优化等步骤。
摘要由CSDN通过智能技术生成

以下文章用于介绍如何使用stable diffusion, 基于真人照片的pt文件制作

照片随机抓取至网络。原始照片举例:

原始照片-1

原始照片-2

经过训练后,由stabel diffusion 生成的照片举例

在这里插入图片描述

stable diffusion生成照片示意-1

在这里插入图片描述

stable diffusion生成照片示例-2

以下基于深度学习的一般流程,介绍一下基于真人照片的pt批处理文件流程

深度学习建模的一般流程

1- 数据处理

首先是原始数据的获得,一般通过网络公开渠道都可以获得原始的训练数据。

1.1 数据清洗

但是我们从网络上获得的大部分数据都需要做一个初步的处理,比如对于过于花哨的背景,需要进行抠像处理;过于模糊的照片或者本身已经失真的照片需要剔除;部分照片如脸上有特效,头发遮住一部分脸庞,身上衣服有大范围的数字和字母、文字,纹身等等,最好予以剔除。

最后得到的初始照片大致如下:

在这里插入图片描述

使用ios相册的抠像功能可以自动抠像

1.2 数据预处理

首先在启动stabel diffusion 之前,进入VAE文件夹,将model.vae.pt文件改为1model.vae.pt,这一步很重要,VAE若自动加载,则训练必失败。

VAE 文件夹位置

随后启动stabel diffusion对于上述图像进行预处理。

VAE 设置为无(后续画图的时候再换回来)

设置反推提示词如下

反推提示词 deepbooru

记得“保存设置”,切记!!!

不保存设置,是无法进行训练的。

1.3 随后进入训练页签,对于图像进行预处理

输入embedding的名字,这个也决定了这个pt的后续名字,方便记忆即可。

初始化文字越简单越好,如果是人像输入1girl即可;如果是画风训练则输入画师的名字即可,方便区分和记忆即可。

每个token的向量数是很重要的,一般与你的初始图片数量有关,如果是人像训练,一般设置数字为6-12, 如果是画风训练则一般10以上。

举例我如果是20张照片,我设置为6;如果40张照片,我一般设置为8或者9;如果有100张照片,我一般设置为16.

生成初始的embedding文件

点击生成embedding文件,显示成功生成pt文件

在这里插入图片描述

成功生成pt文件

1.4 对于原始图像进行预处理

在stable diffusion程序文件夹内,创建一个train文件夹,在train文件夹下,输入你这个人像训练或画风训练的embedding文件夹,在这个文件夹下,再创建一个old文件夹。

在这里插入图片描述

创建三个嵌套的文件夹

将你前期经过抠像的图片存储入上述创建的old文件夹

这里就是初始数据了

1.5 由SD进行图像的预处理

源目录为上述创建的old目录绝对路径。

目标目录和上述目录路径相同,将最后的old改为new

如果是独立显存8G,则宽度高度保持默认的512*512即可;如果是独立显存6G,则宽度高度改为384*384,不然容易爆显存。

另外,即使你的初始照片为1024*768或其他比例,这里也建议保留原始的宽度高度512*512不要修改,不然生成的照片比例会很奇怪。

最下面的选项如图片选择即可。

在这里插入图片描述

点击预处理生成new文件夹,且sd会自动对于你的照片进行文字反推

后台显示对于初始文件进行预处理

显示批处理初始照片进度

SD会自动创建new文件夹,并对于初始照片进行处理

在这里插入图片描述

生成的照片会自动去除原有水印

在这里插入图片描述

SD会根据上述照片反推出来prompt关键词

2 训练配置

进入文生图页面,prompt输入简单内容即可,一般将embedding名字放在最后,不要加太多的prompt,如1girl, realistic即可。

prompt要尽量简单

回到训练页面

embedding选择自己刚才创建的embedding名字

学习率保持默认即可

数据集目录,设置为之前的new文件夹,用预处理过的图像作为数据集目录

日志目录为textual_inversion,如果是画风训练,则下方应选择为style_filewords,如果是人像训练,则下方应选择为subject_fileword

宽度高度保持不变,依旧512*512

最大迭代步数由100000改为10000或20000

下面步数默认500或者250都可以。

在这里插入图片描述

训练参数设置如上

点击“训练embedding”,开始训练模型
在这里插入图片描述

3 SD后台开始训练embedding文件

最下面会显示embedding训练进度,如这里训练20000张图片,需要2.5小时。

4 查看训练结果

在textual_inversion文件夹下,会自动创建一个当天日期的文件夹

在这里插入图片描述

在当天日期文件夹下,会自动创建一个embedding名字的子文件夹

在images下面,会看到每隔500个结果,保存的照片

一般这时候照片会比较难看,但是如果只要还看的出来是原来的画风和人像,就可以不要打断SD,让他继续训练下去,直至完成。

每隔500,会自动保存一个样例,有些像,有些很不像。耐心等SD训练完。

5 校验,调整

20000个图像训练完成

训练完成后,我们就可以直接使用刚才的embedding作为prompt生成照片了

进入文生图页面


输入embedding名字,生成照片
在这里插入图片描述

这是删去定制embedding名字后,同样prompt生成的图片,差异明显。

6 图像模型优化

如果训练完的照片还是不像怎么办?

进入之前提到的\textual_inversion\2023-03-14\yuejiang2\image_embeddings 目录

在image_embedding目录之下,逐个查看,记住比较像的或者符合你审美的过程照片

在这里插入图片描述

比如,记住这个9000的照片

在这里插入图片描述

再选一个13000的照片

进入上述文件夹同级的embedding文件,找到和之前所挑选数字对应的两个pt文件

选择和刚才两个数字相同的pt文件

进入SD安装目录下的 embedding文件夹,将上述两个pt文件复制粘贴进来

将上述两个pt文件存入SD安装目录下的embedding文件夹下

在文生图页面下,记得输入刚才粘贴的pt文件名字

好看的照片变多了,比单纯输入没有数字的embedding文件名好看多了

将9000改为13000,同样生成好看照片的概率增加了。

7 锁定seed,进一步优化

在上述生成照片的十几张照片中,找到一张最顺眼的照片,

点击随机种子选项中的“Reuse seed……”按钮,锁定seed

找一张最顺眼的照片,锁定seed

再次基于锁定seed,重新文生图

锁定seed,用同一张脸再次文生图

8最终效果举例

在这里插入图片描述

(masterpiece), (best quality), realistic, 1girl, yuejiang2-13000

(masterpiece), (best quality), realistic, 1girl, yuejiang2-13000, full body
在这里插入图片描述

(masterpiece), (best quality), realistic, 1girl, yuejiang2-13000, short hair

在这里插入图片描述

(masterpiece), (best quality), realistic, 1girl, yuejiang2-13000, diamond necklace, in beach

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 稳定扩散是一项帮助您生成真人照片的先进技术。无论您是想创建虚拟人物、设计游戏角色还是进行影视特效制作,稳定扩散都能满足您的需求。通过稳定扩散技术,您可以快速、准确地生成高质量的真人照片,节省时间和资源。 稳定扩散利用深度学习算法,通过分析大量真实照片的特征和数据,从而创造出栩栩如生的虚拟人像。它不仅能够生成具有逼真面部特征的照片,还能自动添加人工智能驱动的表情、姿势和情感,使生成照片更加生动和引人入胜。 稳定扩散还提供多种个性化、定制化的功能选项,您可以根据您的需求调整照片的年龄、性别、肤色、发型等参数。这样,您可以轻松创建不同风格和特点的角色,满足您创意的多样化需求。 同时,稳定扩散还与云平台相结合,使您能够随时随地在线生成和编辑真人照片。这为团队协作、快速迭代和灵活的创作流程提供了便利。 总而言之,稳定扩散是一项功能强大、易于操作的技术,能够帮助您快速、准确地生成高质量的真人照片。无论您是从事游戏角色设计、动画制作还是其他创作领域,稳定扩散都是您不可或缺的助手。它将为您的创作带来无限可能,让您的作品更具真实感和吸引力。 ### 回答2: "stable diffusion生成真人照片",旨在通过稳定的扩散技术为用户提供高质量的真实人像照片。以下是关于stable diffusion生成真人照片的几个提示语: 1. 高度还原真实,stable diffusion帮您呈现最真实的美丽风采。 2. stable diffusion,为您创造极致真实的人像照片体验。 3. 专业算法保障,stable diffusion打造迷人无比的真人照片。 4. 别再因照片质量困扰,stable diffusion助您获得高质真人照片! 5. 无需拍摄实景,stable diffusion帮您轻松生成令人惊艳的真人照片。 6. stable diffusion,您的真人照片生成利器,让您轻松展现独特魅力。 7. 极致清晰度,stable diffusion让您真人照片更加逼真赏心悦目。 8. stable diffusion,让您的真人照片更具专业品质,犹如职业摄影师作品。 9. 魅力焕发,stable diffusion引领真人照片新潮流,尽显个人魅力。 10. stable diffusion,为您带来真人照片生成的全新境界,以你为中心,创造绝美大片。 ### 回答3: 稳定的扩散是一种前沿技术,能够以惊人的准确度生成逼真的真人照片。无论是面部特征、头发、眼睛还是肤色,稳定的扩散技术都能够完美还原,仿佛这些照片是由真实的摄影师拍摄所得。无需担心照片出现模糊、颜色不真实等问题,稳定的扩散技术能够保证每个细节都真实而清晰。使用稳定的扩散,您可以轻松地创建个人照片、社交媒体头像或展示产品等用途所需的人物照片。您只需提供人物照片的大致轮廓,稳定的扩散技术将为您生成一个性格鲜明、富于表情的合成像。稳定扩散不仅能够帮助设计师和创作者提高工作效率,还能为游戏开发人员创造出更逼真的角色形象。无论是您需要一幅展示您产品的广告照片,还是需要一张栩栩如生的人脸照片来进行人脸识别等技术实验,稳定的扩散都能够满足您的需求。随着技术的进一步发展,稳定扩散将变得更加出色和准确,因此不论您是专业人士还是普通用户,都能够通过稳定扩散创造出与众不同的真人照片

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值