生成式模型对比:扩散模型、GAN 与 VAE

本文对比了深度生成式模型中的GAN、VAE和扩散模型,分析了它们的基本原理、优缺点以及在不同领域的适用性,以帮助研究者和从业者做出选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

引言

深度生成式模型应用于图像、音频、视频合成和自然语言处理等不同领域。随着深度学习技术的快速发展,近年来不同的深度生成模型出现了爆炸式的增长。这导致人们越来越有兴趣比较和评估这些模型的性能和对不同领域的适用性。在

本文中,我们的目标是提供深度生成式模型的全面比较,包括扩散模型、生成对抗网络(GAN)和变分自编码器(VAE)。我将回顾它们的基本原则、优点和缺点。目标是清楚地了解这些模型之间的差异和相似之处,以指导研究人员和从业者为其特定应用选择最合适的深度生成模型。

在这里插入图片描述

算法概述

GAN [1, 2] 学习生成类似于训练数据集的新数据。它由两个神经网络:一个生成器和一个鉴别器组成,实际上是一个 two-player game。生成器采用从正态分布中采样的随机值并生成合成样本,而鉴别器则尝试区分真实样本和生成样本。生成器经过训练可以产生可以欺骗鉴别器的真实输出,而鉴别器经过训练可以正确区分真实数据和生成数据。图 1 的顶行显示了其工作方案。

VAE [3, 4] 由编码器和解码器组成。编码器将高维输入数据映射为低维表示,而解码器尝试通过将该表示映射回其原始形式来重建原始高维输入数据。编码器通过预测均值和标准差向量,将隐表示编码的正态分布输出为低维表示。图 1 的中间行演示了其工作原理。

扩散模型 [5, 6] 由前向扩散和反向扩散过程组成。前向扩散是一个马尔可夫链,它逐渐向输入数据添加噪声,直到获得白噪声。这不是一个可学习的过程,通常需要 1000 个步骤。反向扩散过程旨在将正向过程反向逐步去除噪声以恢复原始数据。反向扩散过程是使用可训练的神经网络来实现的。图 1 的底行显示了这一点。

特点总结

请添加图片描述

GAN

  • 它由两个神经网络组成:生成器和鉴别器。
  • 通过对抗性损失进行训练。生成器的目的是通过生成与真实样本无法区分的样本来“欺骗”鉴别器。目的是使鉴别器无法区分真实样本和生成样本。
  • 高保真样本。神经网络是收敛的,那么判别器就无法区分真实样本和生成样本。这会产生非常真实的样本。
  • 低多样性样本。对抗性损失没有动力覆盖整个数据分布。当鉴别器训练过度或发生灾难性遗忘时,生成器可能会很乐意产生一小部分数据多样性。这是一个常见问题,称为模式崩溃[2]。
  • 很难训练。确定网络何时收敛可能很困难。不要监控一项损失的下降,而应该查看两项没有简单解释的损失,有时并不清楚你的神经网络发生了什么。通常你需要应对模式崩溃。
  • 通过截断技巧,可以在多样性和保真度之间进行简单的权衡。

VAE

  • 它由两个神经网络组成:编码器和解码器。
  • 通过最大化似然对数进行训练,经过数学简化后,成为 L2 损失。它估计输入样本和生成样本之间的差异。
  • 低保真度样本。有几个原因:
    • 由于编码器预测潜在代码的分布,因此可能存在两个潜在代码分布彼此重叠的情况。因此,如果两个输入具有相同的潜在代码,则最佳解码将是两个输入的平均值。这会导致样本模糊。Gan和扩散模型不存在这个问题。
    • 它具有基于像素的损失。带有头发的图像的生成将由交替的亮像素和暗像素组成。如果生成仅移动一个像素,则与地面真实情况的相似性损失将显着增加或减少。然而,VAE 不保留此类像素级信息,因为潜在空间比图像小得多。这导致模型预测明暗像素的平均值以找到最佳解决方案,从而产生模糊的图像。GAN 不存在这样的问题,因为判别器可以利用样本的模糊性来区分真实样本和生成样本。同样,扩散模型尽管具有相同的基于像素的损失,但不存在此问题。他们依靠从真实情况获得的当前噪声图像结构来预测下一步的去噪。
  • 高多样性样本。似然最大化强制覆盖训练数据集的所有模式,为每个训练数据点提供神经网络容量。
  • 易于训练。它有一个易于处理的似然损失。
  • 编码器使您能够获取任何图像的潜在代码,这提供了超出生成范围的额外可能性。

扩散模型

  • 它由固定的前向扩散过程和可学习的反向扩散过程组成。
  • 前向扩散过程是一个多步骤的过程,逐渐向样本中添加少量高斯噪声,直到变成白噪声。常用的步数值为 1000。
  • 反向扩散过程也是一个多步骤过程,它反转正向扩散过程,将白噪声带回到图像中。反向扩散过程的每一步都由神经网络执行,并且其步骤数与正向过程相同。
  • 通过最大化似然对数进行训练,经过数学简化后,成为 L2 损失。在训练期间,我们使用随机选择的 T 值的公式计算 T 和 T-1 步骤的噪声图像。然后,扩散模型根据 T 步噪声图像预测 T-1 步图像。使用 L2 损失对生成的图像和 T-1 步图像进行比较。
  • 高保真样本。这是由于逐渐消除噪音的本质。与一次性生成样本的 VAE 和 GAN 不同,扩散模型逐步创建样本。该模型首先创建一个粗糙的图像结构,然后专注于在顶部添加精细的细节。
  • 高多样性样本。似然最大化涵盖了训练数据集的所有模式。
  • 中间噪声图像用作潜在代码,并且具有与训练图像相同的大小。这就是扩散模型能够生成高保真样本的原因之一。
  • 易于训练。它有一个易于处理的似然损失。
  • 样本生成缓慢。与 GAN 和 VAE 不同,它需要神经网络多次运行才能逐渐生成样本。尽管有一些采样方法可以将这个过程加速几个数量级,但它们仍然比 GAN 和 VAE 慢得多。
  • 只需利用输入噪声,多步骤过程即可提供新功能,例如修复或图像到图像生成。

结论

GAN、VAE 和扩散模型都是流行的深度学习生成式模型,它们具有独特的功能并适合不同的用例。每种模型都有其优点和缺点,在为特定应用选择模型之前了解其细微差别非常重要。

参考资料

  • Generative Adversarial Nets. Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio — https://arxiv.org/pdf/1406.2661.pdf
  • GAN Mode Collapse Explanation — https://medium.com/towards-artificial-intelligence/gan-mode-collapse-explanation-fa5f9124ee73
  • Auto-Encoding Variational Bayes. Diederik P Kingma, Max Welling — https://arxiv.org/pdf/1312.6114.pdf
  • Understanding Variational Autoencoders (VAEs) — https://towardsdatascience.com/understanding-variational-autoencoders-vaes-f70510919f73
  • Deep Unsupervised Learning using Nonequilibrium Thermodynamics. Jascha Sohl-Dickstein, Eric A. Weiss, Niru Maheswaranathan, Surya Ganguli — https://arxiv.org/pdf/1503.03585.pdf
  • What are Diffusion Models? Lilian Weng — https://lilianweng.github.io/posts/2021-07-11-diffusion-models
### 回答1: PSPICE 17.2 是一种用于电子电路仿真分析的软件工具。下面是一份简单的 PSpice 17.2 使用初级教程: 1. 安装启动:首先,你需要下载并安装 PSpice 17.2 软件。安装完成后,双击图标启动软件。 2. 创建电路:在软件界面上,选择“文件”>“新建”,然后在电路编辑器中创建你的电路。你可以从元件库中选择组件,并将其拖放到画布上。连接元件的引脚以构建电路。 3. 设置元件参数:双击元件以打开元件参数设置对话框。在对话框中,设置元件的值、名称其他参数。对于电阻、电容等基本元件,可以直接输入数值。 4. 设置仿真配置:选择“仿真”>“设置校验”,然后在仿真设置对话框中选择仿真的类型参数。你可以选择直流分析、交流分析、暂态分析等。设置仿真参数后,点击“确定”。 5. 运行仿真:选择“仿真”>“运行”来启动仿真。在仿真过程中,软件将模拟电路的响应,并将结果输出到仿真波形窗口中。 6. 查看仿真结果:在仿真波形窗口中,你可以查看各个元件的电流、电压等参数随时间变化的波形。你还可以对波形进行放大、缩小、平移等操作,以更详细地分析电路的性能。 7. 保存导出结果:在仿真过程中,你可以选择将结果保存为文件或导出为其他格式,如图像文件或数据文件。 以上是 PSpice 17.2 使用初级教程的基本步骤。随着实践的深入,你可以进一步了解复杂电路的建模分析方法,并尝试更高级的功能技术。 ### 回答2: PSPICE 17.2是一款电子电路仿真软件,用于对电路进行分析验证。以下是PSPICE 17.2的使用初级教程: 1. 下载安装:在官方网站上下载PSPICE 17.2并进行安装。 2. 组件库:打开PSPICE软件后,点击“Capture CIS”图标,进入组件库界面。选择适当的电子元件,如电阻、电容、二极管等,将它们拖放到画布上。 3. 电路连接:在画布上拖放所需元件后,使用导线工具连接它们。点击导线图标,选择合适的连接方式,并将其拖动到适当的端口上。 4. 参数设定:双击元件,弹出元件属性对话框。在这里设置元件的数值,例如电阻的阻值、电容的电容值等。 5. 电源设置:在画布上点击右键,选择“Power Sources”,然后选择适当的电源,如直流电源或交流电源。设置电源的电压或电流数值。 6. 仿真设置:点击画布上方的“PSpice”选项,选择“Edit Simulation Profile”打开仿真配置对话框。在仿真配置中,设置仿真参数,如仿真类型(直流、交流、脉冲等)、仿真时间等。 7. 仿真运行:在仿真配置对话框中点击“Run”按钮,开始进行电路仿真运行。仿真完成后,可以查看并分析仿真结果,如电流、电压、功率等。 8. 结果分析:通过菜单栏中的“PSpice>Probe”选项,打开特定信号的仿真结果。通过选择信号节点,可以显示该信号的波形、幅值频谱等信息。 9. 数据输出:仿真结束后,可以通过“PSpice>Results”菜单栏选项,导出仿真结果到文本文件,以供后续分析。 10. 误差调整:如果仿真结果预期不符,可以检查电路连接、元件参数等以找出问题。根据需要进行调整,重新运行仿真以验证改进效果。 以上就是PSPICE 17.2使用初级教程的简要介绍。在使用过程中,请参考软件的帮助文件官方文档,以获取更详细的指导解决方法。任何新的软件都需要不断的实践尝试,希望这个教程能对你有所帮助。 ### 回答3: PSPICE 17.2是一款常用的电路仿真软件,用于电路设计分析。下面是一个简要的PSPICE 17.2的初级教程: 1. 下载安装:首先,从官方网站下载PSPICE 17.2,并按照安装向导进行安装。安装完成后,打开软件。 2. 创建新工程:在PSPICE 主界面上,点击“File”菜单,然后选择“New Project”来创建一个新的工程。给工程起一个适当的名字,并选择工程的存储位置。 3. 添加电路元件:在工程界面上,点击“Place”图标,然后选择不同的元件来构建你的电路。你可以从库中选择各种电子元件,如电阻、电容、电感等,并将它们拖放到工程界面上。 4. 连接元件:选择“Wire”图标,然后点击元件的引脚来连接它们。确保连接顺序正确,以保证电路的正确性。 5. 设置元件参数:对于每个添加的元件,你需要设置它们的参数。右键点击元件,选择“Edit Propertiess”,然后在弹出的窗口中输入适当的参数值。 6. 添加电源:在电路中添加电源,以提供电路所需的电能。选择“Place”图标,然后选择合适的电源元件并将其拖放到电路中。同样,设置电源的参数值。 7. 设置仿真配置:在工程界面上,点击“PSpice”菜单,然后选择“Edit Simulation Profile”来设置仿真配置参数。你可以选择仿真类型、仿真时间仿真步长等。 8. 运行仿真:点击“PSpice”菜单,选择“Run”来运行仿真。PSPICE将自动运行仿真并显示结果。 9. 分析优化:根据仿真结果,可以分析优化电路的性能。你可以观察电流、电压功率等参数,以评估电路的性能,并根据需要进行调整。 10. 保存导出结果:在分析优化完成后,可以保存你的工程并导出结果。点击“File”菜单,选择“Save Project”来保存工程,然后选择“Outut”菜单,选择“Export”来导出结果。 以上是PSPICE 17.2的初级教程的简要介绍。通过以上步骤,你可以开始使用PSPICE 17.2进行电路设计仿真。在实践中不断探索学习,你将成为一个熟练的PSPICE用户。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值