换脸效果媲美GAN！一文解析OpenAI最新流生成模型「Glow」

最新推荐文章于 2025-04-13 22:50:35 发布

PaperWeekly

最新推荐文章于 2025-04-13 22:50:35 发布

阅读量1.1w

点赞数 6

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/81039361

版权

本文介绍了OpenAI的Glow模型，这是一种基于流的生成模型，旨在图像生成领域与GAN竞争。Glow在NICE和RealNVP的基础上加入了可逆1x1卷积，实现精确的潜在变量推断，尤其在人脸属性合成和变换上表现出色。文章回顾了NICE和RealNVP，并详细解释了Glow的Actnorm、可逆1x1卷积和仿射耦合层等关键组件。实验表明，Glow在多个数据集上取得优于其他模型的性能，特别是在高分辨率人脸图像的生成和插值上。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

640

640?

在碎片化阅读充斥眼球的时代，越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里，你会快速 get 每篇精选论文的亮点和痛点，时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区，查看更多最新论文推荐。

这是 PaperDaily 的第 90 篇文章

本期推荐的论文笔记来自 PaperWeekly 社区用户 @TwistedW。基于流的生成模型在 2014 年已经被提出，但是一直被忽视。由 OpenAI 带来的 Glow 展示了流生成模型强大的图像生成能力。文章使用可逆 1 x 1 卷积在已有的流模型 NICE 和 RealNVP 基础上进行扩展，精确的潜变量推断在人脸属性上展示了惊艳的实验效果。

如果你对本文工作感兴趣，点击底部阅读原文即可查看原论文。

关于作者：武广，合肥工业大学硕士生，研究方向为图像生成。

■ 论文 | Glow: Generative Flow with Invertible 1x1 Convolutions

■ 链接 | https://www.paperweekly.site/papers/2101

■ 源码 | https://github.com/openai/glow

图像生成在 GAN 和 VAE 诞生后得到了很快的发展，现在围绕 GAN 的论文十分火热。生成模型只能受限于 GAN 和 VAE 吗？OpenAI 给出了否定的答案，OpenAI 带来了 Glow，一种基于流的生成模型。

虽然基于流的生成模型在 2014 年就已经提出来了，但是一直没有得到重视。Glow 的作者在之前已经在基于流的生成模型上提出了 NICE [1] 和 RealNVP [2]，Glow 正是在这两个模型基础加入可逆 1 x 1 卷积进行扩展，精确的潜在变量推断在人脸属性上展示了惊艳的实验效果，具体效果可在 OpenAI 放出的 Demo [3] 下查看。

论文引入

随着深度神经网络的发展，生成模型也得到了巨大的飞跃。目前已有的生成模型除了 Glow 外包括三大类，GAN、VAE 和 Autoregressive Model（自回归模型）。其中自回归模型和 VAE 是基于似然的方法，GAN 则是通过缩小样本和生成之间的分布实现数据的生成。文中对这些已有的生成模型也做了一个小结：

1. 自回归模型（Autoregressive Model）：自回归模型在 PixelCNN 和 PixelRNN 上展示了很不错的实验效果，但是由于是按照像素点去生成图像导致计算成本高，在可并行性上受限，在处理大型数据如大型图像或视频是具有一定麻烦的。

2. 变分自编码器（VAE）：VAE 是在 Autoencoder 的基础上让图像编码的潜在向量服从高斯分布从而实现图像的生成，优化了数据对数似然的下界，VAE 在图像生成上是可并行的，但是 VAE 存在着生成图像模糊的问题，Glow 文中称之为优化相对具有挑战性。

3. 生成对抗网络（GAN）：GAN 的思想就是利用博弈不断的优化生成器和判别器从而使得生成的图像与真实图像在分布上越来越相近。GAN 生成的图像比较清晰，在很多 GAN 的拓展工作中也取得了很大的提高。但是 GAN 生成中的多样性不足以及训练过程不稳定是 GAN 一直以来的问题，同时 GAN 没有潜在空间编码器，从而缺乏对数据的全面支持。

基于流的生成模型，首先在 NICE 中得到提出并在 RealNVP 中延伸。可以说流的生成模型被 GAN 的光芒掩盖了，但是是金子总会发光。Glow 一文算是将流生成模型推到了学术的前沿，已经有很多学者在讨论 Glow 的价值，甚至有说 Glow 将超越 GAN。

具体还要看学术圈的进一步发展，不过 Glow 确实在图像的生成，尤其是在图像编码得到的潜在向量精确推断上展示了很好的效果。在 OpenAI 放出的 Demo 上展示了很惊艳的实验效果，就人脸合成和属性变化上可以看出 Glow 确实可以媲美 GAN。

基于流的生成模型总结一下具有以下优点：