domain adaptation 之 Maximun Mean discrepancy （一）

最新推荐文章于 2023-05-28 01:53:23 发布

钉马掌的小铁匠

最新推荐文章于 2023-05-28 01:53:23 发布

阅读量459

点赞数

分类专栏： python 机器学习图像特征提取文章标签：机器学习概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39482438/article/details/107819574

版权

本文介绍了最大平均偏差（MMD）的概念，用于判断数据集是否来自同一分布，尤其在处理小数据集的过拟合问题中发挥作用。MMD通过核函数在再生希尔伯特空间中衡量分布差异，高斯核函数是一个常用的实现。深度学习在小数据集上容易过拟合，因为其擅长记忆训练集特征，导致验证集表现不佳。

摘要由CSDN通过智能技术生成

一、最大平均偏差—MMD

对于两份数据集 $X=(x_1, ... , x_m)$ 和 $Y=(y_1, ...,y_n)$ 是否服从同一分布。Maximun mean discrepancy （MMD）就是用来解决这一问题。MMD用于评估两份或多份数据是否来自同一分布。
假设 $F$ 是一类函数 $f:\chi \rarr R$ ， $X$ 和 $Y$ 分别采集自概率分布 $p$ 和 $q$ ，于是得到MMD的定义式 $MMD[F,p,q]:=sup_{f∈F}(E_p[f(x)]-E_q[f(y)])$ 对于已存在的采样 $X, Y$ ，我们使用MMD的无偏估计公式 $MMD[F,X,Y]:=sup_{f∈F}(\frac{1}{m}\sum_{i=1}^mf(x_i)-\frac{1}{n}\sum_{i=1}^nf(y_i))$

这里介绍的 $F$ 为核函数。使用核函数可以很容易地计算MMD，并且有能力在没有假设、没有先验知识的前提下计算 $p$ 和 $q$ 之间的差异。此时对于一类函数 $f:\chi \rarr R$

最低0.47元/天解锁文章

钉马掌的小铁匠

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
domain adaptation 之 Maximun Mean discrepancy （一）

一、小数据集的过拟合问题我们现在了解到的是深度学习适合于大规模数据的应用，而在小规模的数据上易出现过拟合。深度学习的特点是它擅于记忆，它能非常出色地基础训练数据的数据特征，从而在训练的数据上表现优异。在针对特定任务时，大规模的数据往往能涵盖特征空间的绝大部分，此时的训练集的特征空间往往与验证集的特征空间高度重合，深度学习模型在记住训练集特征的同时也就记住了验证集特征，以至于在训练集表现优秀的模型在验证集数据上也能表现很好。但是小规模的数据集通常只占据特定任务特征空间的一部分，此时划分的训练集和验证集的特征
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。