生成对抗网络(GAN)
那什均衡
Nash equilibrium ,又称为非合作博弈均衡。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
对应的,对于GAN来说,生成模型恢复了训练数据的分布(无法分辨生成数据与真实数据),判别模型无法得出正确的判别效果,准确率为50%。这时双方网络都得到利益最大化,不改变自身策略,即不再更新自身的权重。
GAN模型
m
i
n
G
m
a
x
D
V
(
D
,
G
)
=
E
x
∼
P
d
a
t
a
(
x
)
]
[
l
o
g
D
(
x
)
]
+
E
z
∼
p
z
(
z
)
[
l
o
g
(
1
−
D
(
G
(
z
)
)
)
]
\mathop{min}\limits_{G}\ \mathop{max}\limits_{D}V(D,G)=E_{x\sim P_{data}(x)}][log D(x)]+E_{z\sim p_{z}(z)}[log(1-D(G(z)))]
Gmin DmaxV(D,G)=Ex∼Pdata(x)][logD(x)]+Ez∼pz(z)[log(1−D(G(z)))]
- 生成模型G的loss是 l o g ( 1 − D ( G ( z ) ) ) log(1-D(G(z))) log(1−D(G(z)))
- 判别模型的D的loss是 − ( l o g ( D ( x ) ) + l o g ( 1 − D ( G ( z ) ) ) -(log(D(x))+log(1-D(G(z))) −(log(D(x))+log(1−D(G(z)))
也就是G网络的训练是希望 D ( G ( z ) ) D(G(z)) D(G(z))趋近于1,也就是正类,G的loss最小.而D网络是一个二分类,目标是分出真实数据和生成数据,也及时希望真实数据的输出趋近于1,而生成数据的输出 D ( G ( z ) ) D(G(z)) D(G(z))趋近于0.
参考文章