摘要主要强调以下几点:
1. 当domain discrepancy比较大的时候,文章中方法的性能比其余方法要好的多(实验部分的确如此)
2. re-weighted:在训练discriminator D的时候,每一个source sample并不是同等重要,weight取决于label
3. 在匹配source sample和target sample的特征分布的时候,用的是基于EM 距离的OT方法
4. 将2和3嵌入到同一个框架中,实现end-to-end training
方法:RAAN模型
主要包含三个网络:Ts, Tt, 和D, 先训练Ts和CLS, 再训练Tt和D来匹配Ts
(1)基于OT的adversarial learning
先给出两个特征的概率密度函数:
再转换成用联合分布解决匹配问题