domain adaptation 之 Maximun Mean discrepancy (一)

本文介绍了最大平均偏差(MMD)的概念,用于判断数据集是否来自同一分布,尤其在处理小数据集的过拟合问题中发挥作用。MMD通过核函数在再生希尔伯特空间中衡量分布差异,高斯核函数是一个常用的实现。深度学习在小数据集上容易过拟合,因为其擅长记忆训练集特征,导致验证集表现不佳。
摘要由CSDN通过智能技术生成

一、最大平均偏差—MMD

对于两份数据集 X = ( x 1 , . . . , x m ) X=(x_1, ... , x_m) X=(x1,...,xm) Y = ( y 1 , . . . , y n ) Y=(y_1, ...,y_n) Y=(y1,...,yn)是否服从同一分布。Maximun mean discrepancy (MMD)就是用来解决这一问题。MMD用于评估两份或多份数据是否来自同一分布。
假设 F F F是一类函数 f : χ → R f:\chi \rarr R f:χR X X X Y Y Y分别采集自概率分布 p p p q q q,于是得到MMD的定义式 M M D [ F , p , q ] : = s u p f ∈ F ( E p [ f ( x ) ] − E q [ f ( y ) ] ) MMD[F,p,q]:=sup_{f∈F}(E_p[f(x)]-E_q[f(y)]) MMD[F,p,q]:=supfF(Ep[f(x)]Eq[f(y)])对于已存在的采样 X , Y X,Y X,Y,我们使用MMD的无偏估计公式 M M D [ F , X , Y ] : = s u p f ∈ F ( 1 m ∑ i = 1 m f ( x i ) − 1 n ∑ i = 1 n f ( y i ) ) MMD[F,X,Y]:=sup_{f∈F}(\frac{1}{m}\sum_{i=1}^mf(x_i)-\frac{1}{n}\sum_{i=1}^nf(y_i)) MMD[F,X,Y]:=supfF(m1i=1mf(xi)n1i=1nf(yi))

这里介绍的 F F F为核函数。使用核函数可以很容易地计算MMD,并且有能力在没有假设、没有先验知识的前提下计算 p p p q q q之间的差异。此时对于一类函数 f : χ → R f:\chi \rarr R f:χR<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值