【MomoTalk之Stable Diffusion】本地部署与风格探索

本文介绍了在项目实施前如何本地部署StableDiffusionWebUI,重点讲述了使用LoRA进行模型调整以适应项目需求,以及尝试让生成的图像具有更多动态效果的过程。尽管存在一些问题,如人物特征不清晰,但作者认识到图像仅作为语音系统辅助,对生成质量有所宽容。
摘要由CSDN通过智能技术生成

        在项目内容正式实施前,这次的任务是本地部署Stable Diffusion Web UI,探索一下符合项目需求的图像风格。

WebUI的下载与安装

        去年在SD1.5大火的时候就尝试过WebUI,因此此次的配置并不难,从Github仓库拉取更新了一下本地代码,并且根据引导重新配好了环境,区别似乎在于PyTorch的版本更高了,但页面和功能还是熟悉的样子。

Fine-tune模型与LoRA的收集

        本次的MomoTalk项目是源于BA,因此需要能够生成其中的人物,这自然是借助LoRA实现,兴致勃勃地在Civitai上下载了一个看起来不错的爱丽丝LoRA和Q版人物LoRA,结果用标准SD1.5生成后得到了一张一言难尽的图片:

        人物特征基本满足完全没法因此只能寻求下载一个Fine-TuneSD最后,简单筛选选择了对动漫人物更有理解meinamix,从而拿到了一个比较不错的效果。

        虽然光环明显的错乱,手也不甚科学,但至少人物不再是抽象

图像生成的尝试

        下一步就是尝试能否爱丽丝表现出各种各样动作和表情,从而穿插对话当中。在最后的对接当中,文本模型将会给出一个“表情描述字段这个字段就是Prompt里唯一需要替换东西

        经过尝试爱丽丝动作维持几个相对固定状态表情变化更是难以控制毕竟图像只是辅助整个语音系统介质之一因此也就过多苛求

  • 8
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值