加入GRL的目的是为了让领域判别器和特征提取器之间形成一种对抗。先不管标签分类器,领域判别器就是GAN里的判别器,目的就是区分出real(目标域)与fake(源域),所以领域判别器的目的同样也是最小化领域判别误差,特征提取器就是生成器,特征提取器尽量输出一个能够逃过判别器的特征向量f。此时特征提取器的优化目标则是1.减少sigmod(f)与real之间的损失,而域判别器的目标则是:2.减少来自于目标领域的sigmod(f)与fake的损失 3.减少来自于源领域的sigmod(f)与real的损失,对抗关系则是:1与2之间的对抗。
假如没有GRL,那么来自于域判别器的梯度对特征提取器的参数更新目的则是服务于2和3,加入了GRL后,梯度取反,那么特征提取器的参数更新目的则是与2相反,即服务于1.以此形成一种对抗,最后达到平衡。而标签分类器的训练只是并行训练,目的是使得生成的特征向量f依旧有分类能力,并没有与特征提取器有对抗关系,所以不用GRL反转
——来自网友xx_ILY2020.10.06