领域泛化
领域泛化(Domain GeneralizationDG) 是近几年非常热门的一个研究方向。它研究的问题是从若千个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在 未知(Unseen)的测试集上取得较好的效果。
领域泛化问题与领域自适应(领域自适应,da) 最大的不同:
DA在训练中,源域和目标域数据均能访问(无监督DA中则只有无标记的目标域数据);而在DG问题中,我们只能访问若千个用于训练的源域数据,测试数据·是不能访问的。毫无疑问,DG是比DA更具有挑战性和实用性的场景: 些竟我们都喜欢“一次训练、到处应用”的足够泛化的机器学习模型例如,在下图中,DA问题假定训练集和测试集只都可以在训练过程中被访问,而DG问题只中则只有训练.
其中
1.数据操作,指的是通过对数据的增强和变化使训练数据得到增强。这-类包括数据增强和数据生成两大部分。
**2表征学习,**指的是学习领域不变特征(Domain-invariantrepresentation learning)以使得模型对不同领域都能进行很好地适配。领域不变特征学习方面主要包括四大部分: 核方法、显式特征对齐、领域对抗训练、以及不变风险最小化(Invariant Risk MinimiationIRM)。特征解耦与领域不变特征学习的目标一致、但学习方法不一致。
**3.学习策略,**指的是将机器学习中成熟的学习模式引入多领域训练中使得模型泛化性更强。这一部分主要包括基于集成学习和元学习的方法。同时,还有其他,如自监督方法在领域泛化中的应用。