- 论文链接:DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models
- 代码:https://github.com/google-research/google-research/tree/master/dpok
- 关注公众号funNLPer分享有趣的算法知识
在之前我们已经了解过了DDPO: Training Diffusion Models with Reinforcement Learning,今天介绍一篇类似的论文DPOK
文章目录
1. Introduction
最近扩散模型在文生图领域获得了很大的进步,但是当前的模型仍然存在一些问题,如:多目标物体组合能力有限,生成指定颜色数量的物体的能力仍然欠缺。
基于人类反馈进行模型的学习已经被证明能够提升文生图模型的效果,但是通过