标题
DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation
DreamBooth:微调文本到图像的扩散模型,用于主题驱动的生成
总结概括
Summary
这篇论文提出了一种名为 DreamBooth 的新方法,用于个性化文本到图像扩散模型。只需几张主体的图像,DreamBooth 就可以微调预训练的文本到图像模型,将唯一标识符与该特定主体绑定。这使得模型能够在不同的上下文、姿势、视角和照明条件下合成主体的新颖逼真图像,同时保留主体的关键视觉特征。作者将 DreamBooth 应用于各种基于文本的图像生成任务,如主体重新情境化、基于文本的视图合成和艺术渲染。他们还提供了一个新的数据集和评估协议,用于这种以主体为驱动的生成新任务。
Key Points
- DreamBooth 通过在少量主体图像上微调文本到图像扩散模型来实现个性化。
- 微调后的模型可以在不同的背景、姿势、视角和光照条件下合成主体的新图像。
- DreamBooth 被应用于主体重新情境化、基于文本的视图合成和艺术渲染等任务。
- 作者提供了一个新的数据集和评估协议来支持主体驱动的生成任务。