Collaborative_Diffusion 文章解读

最新推荐文章于 2024-06-27 15:39:44 发布

SuperGoodGame

最新推荐文章于 2024-06-27 15:39:44 发布

阅读量190

点赞数

分类专栏：实验室 headTalker 文章标签：人工智能计算机视觉

本文链接：https://blog.csdn.net/SuperGoodGame/article/details/132827652

版权

实验室同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

headTalker

2 篇文章 0 订阅

订阅专栏

自己整理版

贡献

我们提出了协作扩散（Collaborative Diffusion），用户可以使用多种模式来控制面部生成和编辑。
(a) 人脸生成。考虑到多模式控制，我们的框架合成与输入条件一致的高质量图像。(b) 脸部编辑。协作扩散还支持真实图像的多模式编辑，具有良好的身份保存功能。

我们使用预先训练的单模态扩散模型来执行多模态引导面部生成和编辑。在反向过程的每一步（即从时间步 t 到 t − 1），动态扩散器预测空间变化和时间变化的影响函数，以选择性地增强或抑制给定模态的贡献。

(1) 我们提出了 Collaborative Diffusion，一种简单有效的方法来实现不同扩散模型之间的合作。
(2) 我们充分利用扩散模型的迭代去噪性质，设计了 Dynamic Diffuser 来预测在时间和空间上均有适应性的 Influence Functions 来控制不同的扩散模型如何合作。
(3) 我们实现了高质量的多模态控制的人脸生成和编辑。
(4) Collaborative Diffusion 是一个通用的框架，不仅适用于图片生成，还适用于图片编辑，以及未来更多的基于扩散模型的其他任务。