前言:今年prompt learning提示学习和diffusion models扩散模型实在是太火了,最新的ICLR 2023的一项工作把两者结合了起来,取得了十分惊艳的效果!正好昨天代码刚刚开源,这篇博客就和大家一起解读一下原理与代码!
目录
贡献概述
图像编辑技术为什么是困难的?
编辑对于这些生成模型来说是具有挑战性的,因为编辑技术的固有属性是保留原始图像中的一些内容,而在基于文本的模型中,即使是对文本提示符的一个很小的修改通常也会导致完全不同的结果。最新的方法通过要求用户提供空间掩码来本地化编辑,从而缓解了这一问题,因此忽略了掩码区域内的原始结构和内容。
例如下图的GLIDE图片编辑工作,需要先加入mask才能编辑新的部分: