Mix-of-Show: Decentralized Low-Rank Adaptation forMulti-Concept Customization # 论文阅读

最新推荐文章于 2024-07-08 18:48:12 发布

奔跑的汉堡包

最新推荐文章于 2024-07-08 18:48:12 发布

阅读量416

点赞数 3

文章标签：去中心化论文阅读区块链

本文链接：https://blog.csdn.net/qq_29679623/article/details/138688653

版权

#URL
https://arxiv.org/pdf/2305.18292

TL;DR

23 年 5 月腾讯 PCG + 新加坡国立大学的文章。提出了一种多角色保持方案，同时还可以生成背景和交互的物体。核心是多 lora 融合，并在其中提出了一些优化点。
在这里插入图片描述

文章的主要贡献：

提出一种多人 id 保持的生成框架，使用 embedding decomposed lora 和梯度融合的训练策略，解决多个 lora 融合产生的多 id 融合怪问题。
提出一种 regionally controllable sampling 的概念，来解决多人 controlnet 纹理、细节丢失的问题

本文提出的方法如下图，整个框架分为 3 个部分，分别是：

首先作者给出了一些分析，如下图

单独训练 ip lora 阶段：就是 lora 训练，添加了额外的 layer-wise embedding
提取融合阶段：SD 不依赖训练数据，可以得到前向各个位置的梯度，然后对每一个 lora 分别计算梯度，用融合的方式来 fuse 各个 lora 模型
reginally contrallable sampling：先给一个 global prompt，然后从出来的特征中提取局部特征，再送入 regional prompts

在这里插入图片描述