机器学习的数学基础（7）：防止过拟合的两种方法，正则化与截断svd

最新推荐文章于 2023-04-23 17:56:17 发布

面对疾风的小龙

最新推荐文章于 2023-04-23 17:56:17 发布

阅读量780

点赞数 1

分类专栏：机器学习的数学基础文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43014877/article/details/122117557

版权

机器学习的数学基础专栏收录该内容

7 篇文章 7 订阅

订阅专栏

过拟合

本文将从数学的角度解释为何会出现过拟合，以及防止过拟合的两种方法：正则化与截断svd法

重现列一下最小二范数的最小二乘问题：

从上文中我们可知，最小二乘问题的最小二范数解满足如下的形式：

这里我们将矩阵拆开，用奇异值对应项的和对该解进行表示，则有：

过拟合顾名思义，就是过度的拟合了数据的规律，因此拟合的函数在训练集上表现的很好，但是缺少泛化性，在测试集中的性能不好。我们现在来分析对于最小二范数的最小二乘问题来说，什么时候会出现过拟合呢：观察解的形式，当矩阵A存在非常小的奇异值时，y前面的系数就会变得非常大，而这样就会造成，当给y的数据有微小波动时，其对应的解x（也就对应着系数，最终对应的是拟合出来的函数）波动会非常大。这也就意味着一件事，当给定的训练集所对应的矩阵A中，存在非常小奇异值的时候，训练出来的函数泛化性是极差的，因为只要在测试集，y有轻微的波动，则测试集对应出的函数将会和训练集有非常巨大的差距。

截断奇异值分解

我们刚刚已经分析了在最小二范数的最小二乘问题中，过拟合出现的情况为当矩阵A存在非常小的特征值时。显而易见的思路是，直接将小的奇异值所对应的项删去。如下所示：

其中R‘是截断后所剩余的奇异值个数。截断svd通过分析问题的源头，解决了问题，但这样做也同样会牺牲拟合函数在训练集上的性能。那么此时解的形式为：

正则化

正则化也被称之为脊回归，我们直接采用了另一种回归方式重构了最小二乘问题如下：

其中 $\delta$ 是一个常量，人为进行定义。同最小二乘的思路一样，我们对上述目标函数的x求梯度，则得到如下的等式：

这里因为有单位矩阵I的存在，因此是一定可逆的。所以我们的解可以表示为：

进一步的我们对A进行SVD分解，则解可以表示为：

至此我们可以清晰的看到为何正则化可以防止过拟合了。当奇异值远大于 $\delta$ 时

而当奇异值远小于 $\delta$ 时：

而这就很大程度的避免了奇异值过小所导致的系统不稳定以及过拟合

面对疾风的小龙

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习的数学基础（7）：防止过拟合的两种方法，正则化与截断svd

本文将从数学的角度解释为何会出现过拟合，以及防止过拟合的两种方法：正则化与截断svd法这里我们将矩阵拆开，用奇异值对应项的和对该解进行表示，则有：其中矩阵的秩为R...
复制链接

扫一扫

专栏目录

面对疾风的小龙 CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

110万+: 周排名

32万+: 总排名

1万+: 访问

: 等级

89: 积分

12: 粉丝

8: 获赞

1: 评论

37: 收藏

私信

关注

热门文章

分类专栏

机器学习的数学基础 7篇

最新评论

openGauss中存储过程的使用详解
CSDN-Ada助手: 恭喜您写了第8篇博客！标题“openGauss中存储过程的使用详解”听起来非常有趣和实用。您对openGauss中存储过程的详细解释一定会帮助到很多读者，尤其是那些对此领域感兴趣的人。在下一步的创作中，我想建议您可以考虑探讨一些更深入的主题，或者分享一些您在使用openGauss存储过程时遇到的挑战和解决方案。这样可以帮助读者更好地理解和应用这些概念，并提供实际应用中的指导和建议。再次恭喜您，并期待您未来更多的博客文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。