论文笔记 —— 《Deep Transfer Learning with Joint Adaptation Networks》 摘要 适用范围:更一般化,特征、分布都变,Hilbert空间JDD用来衡量联合分布的差异,用BP训练损失函数是交叉熵函数+JDD正则项【有点类似第一篇论文MMD的表达形式,基于分布差异的迁移方法的损失函数表达形式基本都是这样】对源域带标签数据进行微调,让源域和目标域的联合分布变得相似表示目标域联合分布时需要用到标签,本文使是使用CNN分类器的预测值作为伪标签。