https://arxiv.org/pdf/2311.10093.pdf
目标:
- 生成与文本描述一致的角色图像,并在不同上下文中保持角色的一致性。
关键问题:
- 现有的文本到图像生成模型难以生成具有一致性的角色图像,这对于多种应用场景(如故事可视化、游戏开发等)至关重要。
方法:
- 提出了一个全自动的迭代过程,不需要目标角色的预存图像。
- 使用预训练的特征提取器将生成的图像嵌入到语义空间中,并进行聚类。
- 通过选择最内聚的群集并对其进行身份
https://arxiv.org/pdf/2311.10093.pdf
目标:
关键问题:
方法: