最大均值差异是迁移学习中使用频率最高的度量。 Maximum mean discrepancy,它度量在再生希尔伯特空间中两个分布的距离,是一种核学习方法。简单地理解就是计算两堆数据的均值距离,但是实际比较难计算。就将两个分布映射到另一个空间计算距离。计算距离的方法是,计算分布上每一个点映射到另一空间的距离然后求和。
MMD的基本原理:假设一个满足P分布的数据集和一个满足Q分布的数据集并且存在一个再生希尔伯特空间H(RKHS)存在一个映射函数表示从原始空间到希尔伯特空间的一个映射,并且当n,m趋于无穷时和的最大均值差异可以表示为:
从公式中可以看出,对每一个样本先投影并求和,求每个数据集的均值,再求差。