FaceChain学习笔记

Aaaaaki

已于 2023-09-23 19:45:32 修改

阅读量616

点赞数 1

文章标签：笔记 stable diffusion

于 2023-09-23 19:45:06 首次发布

本文链接：https://blog.csdn.net/selectnothing/article/details/133215530

版权

大体上来看，FaceChain所做的是训练出一个包含用户面部信息的LoRA模型，然后在推理阶段将该面部LoRA与风格LoRA进行结合并注入，最终实现风格化照片的生成。
当然实际应用肯定没我说的那么简单，在整个框架中，FaceChain应用了多种SOTA模型来满足各环节的需求：

P.S.之所以使用人脸融合，大概率是SD生成的人脸不像，为了保证相似度，需要从原始图像中切出人脸进行融合。
这些模型共同构成了整个FaceChain的服务框架，并且ModelScope上均有权重提供（有效避免下载痛苦）
至于训练和推理流程，在官方README中均有介绍，这里不做过多赘述。

FaceChain

整体流程如下：

这里可以参考DataWhale所提供的部署教程：酷蛙部署-三张照片拥有不一样的你
按流程操作即可，阿里云会送5000核时的A10使用时间
注：个人在应用时偶尔会出现NoteBook中Gradio地址无法点击的情况，换去Terminal中重新运行即可

完成部署并正常运行后，点击链接进入Gradio界面

选好基模型并上传图片，进行训练即可。
完成训练后，页面最下方会出现提示信息，切换去旁边风格写真页面。

在风格写真这有几个关键点需要注意：

训练时使用的什么基模型，推理时仍需选择那个基模型，不然找不到你的LoRA
姿态控制部分如果想使用自己的姿态图像，一定要背景干净，不然会训练失败。
这篇博客(https://zhuanlan.zhihu.com/p/655725253)中大佬指出去掉constants.py中第4、5行pos_prompt_with_cloth与pos_prompt_with_style中自带的【slim body】可能会提高一些生成效果。个人测试下来感觉有，但不明显，个人猜测在男性照片生成时且体型较健壮的图像上可能会明显些。

原始图像	生成结果

个人感觉还是蛮像的XD

关注