《Understanding and Stabilizing GANs’ Training Dynamics using Control Theory》阅读笔记

最新推荐文章于 2024-10-01 20:22:14 发布

巍巍微澜

最新推荐文章于 2024-10-01 20:22:14 发布

阅读量206

点赞数 1

分类专栏：生成模型文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/weixin_44846680/article/details/121918956

版权

生成模型专栏收录该内容

9 篇文章 2 订阅

订阅专栏

《Understanding and Stabilizing GANs’ Training Dynamics using Control Theory》阅读笔记

1 总结

这是一篇从控制论角度分析GAN的稳定性的文章，主要利用到控制论中非常经典的负反馈思想，将目标函数进行拉氏变换投影到频域，根据迁移函数分析系统是否稳定，对于不稳定的系统再根据负反馈的原理进行设计和改进。

2 控制论前瞻

2.1 拉氏变换简介

本节简要介绍这篇文章里用到的控制论方法的一些知识，非常之基础，没有控制论相关背景也可以理解。

函数建立的是一个输入、输出之间的关系，将输入记为 $\boldsymbol{u}$ ，输出记为 $\boldsymbol{y}$ ，假如输入是一个随时间变化的值，记为 $\boldsymbol{u}(t)$ ，那么输出也将是随时间变化的值，同样可以记为 $\boldsymbol{y}(t)$ ，我们可以把这种随时间变化的变量记为信号（Signal）。接着，可以给出输出 $\boldsymbol{y}(t)$ 与时间 $t$ 之间的微分方程：

上式中的 $f (\cdot, \cdot)$ 就可以视为输出关于时域的微分方程表达式，如果想要转换到频域，可以进行拉氏变换：

拉氏变换最大的一个便捷性就是可以把时域中的求导或积分运算变成频域中的乘除法，比如求导运算：

在频域上就相当于原始函数的拉普拉斯表达式乘上了一个拉普拉斯算子。

此外，对于函数：
$\boldsymbol{y}(t) = h(\boldsymbol{u}(t))$
其在频域中的关系为：
$\boldsymbol{Y}(s) = \boldsymbol{T}(s)·\boldsymbol{U}(s)$
这里的 $\boldsymbol{T}(s)$ 被称为迁移函数，是控制论分析中非常重要的一个东西，基本上做系统的稳定性设计都是对它进行各种操作。

2.2 系统稳定性条件

我们一直在说稳定，到底一个系统怎么样才算稳定呢？在控制论的定义里，随着 $t$ 不断变化， $\boldsymbol{y}(t)$ 最终将趋近于一个固定的值，那么这个系统就是稳定的；而如果不管时间过了多久， $\boldsymbol{y}(t)$ 始终在某一个区间内来回摆动，那这个系统就是震荡的，最典型的就是正余弦函数；反之，如果一个系统随着时间的增大， $\boldsymbol{y}(t)$ 的绝对值也越来越大，那这个系统就是发散的。

那么如何判断一个系统是不是稳定的呢？这完全取决于我们的迁移函数 $\boldsymbol{T}(s)$ ，通常，迁移函数会被写成一个关于 $s$ 的分式，其极点为使分母表达式为0的点，假如：

所有极点的实部都是负的，那么这个系统是稳定的（理想系统）；
至少存在一个极点的实部为0，那么这个系统是震荡的（某些情况面前能用）；
至少有一个极点存在正实部，那么这个系统的发散的（用不了）。

2.3 负反馈

从上一节的分析，可以知道一个系统稳不稳定，取决于其迁移函数 $\boldsymbol{T}(s)$ ，因此，我们只需要设计合理的迁移函数，使其所有极点的虚部均为负值即可，而实际情况中，很多时候这种迁移函数是难以获得的，后面引入了一个负反馈的思想，使用系统的输出对输入进行矫正，最终获得一个相对更加稳定的输出:
$\boldsymbol{Y}(s) = \boldsymbol{T}((s)·\boldsymbol{U}(s)-\boldsymbol{T}_b(s)\boldsymbol{Y}(s))$
上面那个式子是一个经典的负反馈表达式， $\boldsymbol{T}_b(s)$ 是额外施加在输出上的一个迁移函数，通过这么一通操作，我们的输出表达式就变成了：

相当于我们通过负反馈改变了原始的迁移函数，从而提供了构造稳定迁移函数的可能。负反馈有很多优点，不过我们的重点是分析GAN的稳定性，在此略过。

3 从控制论看GAN的优化

3.1 参数信号化

作者给出了GAN的通用优化函数表达式：

其中， $c$ 表示输入，也就是真实数据， $\phi$ 代表 $\mathcal{D}$ 的参数， $\theta$ 代表 $\mathcal{G}$ 的参数， $h_1-h_3$ 表示不同的函数，对于不同的GAN，有不同的选择和设计。上面的两个公式定义了 $\phi$ 和 $\theta$ 的表达式，这里作者直接给出了他们的微分方程表达式：

此处没有太看明白推理的逻辑，按照作者描述的理由是因为参数的更新来自于梯度下降法，因此两个微分方程等价，留个坑，我们先按照他的这个表达式继续往下走，进一步分解这两个微分方程：

关于 $\mathcal{D}$ ：

关于 $\mathcal{G}$ ：

对于Dirac GAN， $D(x)=\phi x$ ，从而有：

根据上面的公式，只需要知道 $h_1-h_3$ 的表达式，就可以得出关于GAN网络参数的拉氏变换，进而能够通过迁移函数判断系统的稳定性。

作者对几个经典的GAN网络的稳定性进行了相关分析，表中的Dirac GAN是一种GAN的改进方案。

作者发现几种模型从控制论角度都无法稳定。

3.2 GAN的稳定性策略

基于上面的分析，这篇文章希望可以使用负反馈方法实现GAN模型的稳定性训练，负反馈控制也称为闭环控制，也就是论文里反复用到的CLC。

具体来说，作者希望应用CLC提升模型稳定性时需要满足以下要求：

应用CLC之后 $\mathcal{G}$ ， $\mathcal{D}$ 的参数微分方程需要是稳定的；
引入闭环控制后，不能改变 $\mathcal{G}$ 的平衡点，也就是说，加入闭环控制只可以改变模型的稳定性，而不能改变原有的模型效果。

3.2.1 基于DiracGAN的稳定性策略

如果使用DiracGAN的架构，根据 $\mathcal{G}$ ， $\mathcal{D}$ 的关系，只要 $\mathcal{D}$ 的参数稳定了， $\mathcal{G}$ 就能同时满足稳定性条件，因此无需进行额外的闭环控制。对于Dirac-WGAN，直接令 $\boldsymbol{T}_b(s)=\lambda$ 为一个常数，可以将鉴别器的迁移函数变成：