论文阅读:DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

论文链接
代码链接
DreamBooth
这篇文章提出了一个新的个性化文生图模型方法:DreamBooth。给定几张参考图片,然后微调预训练的文生图模型,使得模型具备生成这些图片对应的特定物体的能力。在推理阶段,只需输入包含该特定物体的场景提示词,即可生成处于指定场景的特定物体的图片。
Fine-tuning
论文中指出,文生图模型微调会面临两个威胁:language drift和reduced output diversity。为了解决这两个威胁,作者使用了一个先验保存损失项,即下面的损失函数公式(2)的第二项。该项对使用原始的文生图模型生成的样本微调模型的过程进行约束,以保持微调后的模型的先验知识不被遗忘,对应上面的图3下方的黄色模型的微调过程。公式中的第一项,将参考图片对应的知识嵌入到模型中,对应上面的图3上方的黄色模型的微调过程。
损失函数
DreamBooth在量化评估比较和用户偏好调查中均优于基准方法:
quantitative metric comparison and user preference

  • 9
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值