一图看懂对抗神经网络中判别器怎么工作的

最新推荐文章于 2024-08-24 11:36:16 发布

抢我糖还想跑

最新推荐文章于 2024-08-24 11:36:16 发布

阅读量9.5k

点赞数 11

分类专栏：深度学习文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/qq_41749451/article/details/120996217

版权

深度学习专栏收录该内容

37 篇文章 4 订阅

订阅专栏

博客探讨了GAN（生成对抗网络）的工作原理，特别是判别器如何在无标签情况下进行判别。判别器的训练依赖于与生成器的对抗过程，而非预设的标签。生成器与判别器通过不断迭代，生成器试图生成更真实的样本，而判别器则努力区分真假。在这个过程中，判别器的“依据”并非固定，而是随着训练动态调整，以适应生成器的改进。最终，二者的博弈促使生成器生成更加逼真的数据，而判别器的判别能力也随之增强。

摘要由CSDN通过智能技术生成

先梳理问题，后解答

1、对GAN网络总有个疑问，判别器是依据什么进行判别的？依据又由何而来？

这个问题至关重要，因为“依据”意味着有标签，人为提供给了神经网络标签，它才能训练好，能够识别想要认识的东西。但是在无标签的聚类中，尚未知标签，又要怎么学习训练呢？
以鉴别假币为例，人通过学习鉴别假币的种种方法，才能对假币进行识别。按这个逻辑，要想训练GAN，首先通过大量真实标签训练判别器，教会它判别方法，然后固定住判别器，训练生成器。如此吗？

2、接上个问题，“依据”是否是固定不变的？
浅显的理解中，生成器与判别器是迭代训练的，训练次数越多，生成器生成的数据越“逼真”，判别器判假能力越强大。很明显，生成器在不断学习新的“造价”能力，判别器也在不断提高“判假”能力，此时判假依据肯定不能是固定的了，网络也不能是初始训练完不再更新的那种了。问题又回到了：究竟怎么“判假”的？怎么学习“判假”能力的？

解答：
在这里插入图片描述
上图根据代码理解后绘制，重点在于两个红圈：sharp、counter

首先说明第一点：判别器的“依据”并非提前获得，而且也并不知道真实“依据”。这点理解起来可能会大跌眼镜：都不知道真实“依据”，凭什么判别真与假呢？

注意到输入判别器的共有两项，分别是生成器生成的membership和true label，此时true label并非该样本的真实标签，它仅仅是one hot向量，通过判别器约束membership与one hot向量逼近。意义在于该one hot的作用并非代表了真实类别，而是作为最sharp形态，约束membership也更sharp，从而类别更明显。

仅仅要求生成的membership更sharp，且是随机sharp，就能提高类别精度，这恐怕没有道理，因为one hot是随机生成，无法保证恰好是正确的类别，此时判别器与生成器是割裂的状态，二者没有任何联系，为了使判别器对生成器生成的membership也能奏效，引入了“对抗”部分：将membership从判别器输出结果取负，作为loss对生成器进行bp更新。

至此，两部分作用已添加完成：
1、生成器生成的membership与判别器输出的结果互为相反数，二者形成对抗关系，通过梯度下降寻求较优参数，使membership达到一个较为平衡的结果，我们认为此时已经具有了良好的分类精度，判别器难以继续通过对结果取负数的方式约束更新生成器了，也就是俗称判别器“判不出来真伪”了。
2、判别器引入非真实标签的true label，意在约束membership更sharp，使类别更清晰可辨。