过拟合之正则化方法

最新推荐文章于 2023-04-05 15:37:30 发布

v1_vivian

最新推荐文章于 2023-04-05 15:37:30 发布

阅读量1k

点赞数

分类专栏： Andrew Ng 机器学习笔记文章标签：过拟合正则化正规化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/v1_vivian/article/details/69675651

版权

Andrew Ng 机器学习笔记专栏收录该内容

15 篇文章 5 订阅

订阅专栏

本文深入探讨了正则化作为防止过拟合的策略，通过在代价函数中添加正则项来限制参数大小，从而达到简化模型的目的。通过调整正则化参数λ，可以在拟合训练集和保持模型简单之间找到平衡。过大或过小的λ会导致模型过于简单或复杂，正则化提供了一种自动化选择λ的方法。

摘要由CSDN通过智能技术生成

当发生过拟合时，我们有两种方法：

（1）尽量减少选取变量的数量

（2）正则化（保留所有的特征变量，减少特征变量的数量级）

本篇博文分析正则化方法降低过拟合的原理和方法。

让我们在原本的代价函数中添加两项：

现在，如果我们要最小化这个函数，我们会尽量让θ3~0，θ4~0，这就相当于将下面右图中产生较大过拟合影响的后两项变量删掉。这样我们最终也得到一条恰当的拟合曲线。

从上面的分析可以看出，如果我们的参数值较小的话，我们就会得到一个更为简单的假设。

上例中，我们将θ3~0，θ4~0，就是惩罚这两个参数，让他们变小，但是实际中，我们并不知道需要将哪些参数缩小，所以正则化的思路就是给所有的参数都加上惩罚，形成新的代价函数：

现在我们就会使θ1，θ2，θ3，……θn都减少，按照惯例我们从θ1开始，不去惩罚θ0，实际产生的结果是：包不包括θ0这一项，结果的差异非常小。

上式中，我们新加入的项叫做正则项，λ叫做正则化参数。

对于新的代价函数，我们有两个目标:

（1）我们希望更好的拟合训练集

（2）我们希望让参数较小

其中，λ的作用就是保持这两个目标之间的平衡。

如果λ过大，将对很大的惩罚参数值，会使所有的参数值都接近于0，最终得到一条近似的水平线。

如果λ过小，则不能很好的阻止过拟合。

有很多方法是可以自动选择λ值的，这就是高度正则化的思路。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

v1_vivian CSDN认证博客专家 CSDN认证企业博客

码龄10年

40: 原创

12万+: 周排名

108万+: 总排名

45万+: 访问

: 等级

3115: 积分

328: 粉丝

443: 获赞

180: 评论

1461: 收藏

私信

关注

热门文章

分类专栏

最新评论

SPP-Net论文详解
草洛白: 我也有该疑问很迷惑qaq 所以到底能不能直接输入都不一样尺寸的图片呢
SPP-Net论文详解
woe007: 因为RCNN是对每个候选框做一次cnn，而SPP-net对整图一次cnn，但还要找到对应候选框的区域，此时候选框的大小不一，所以用SPP产生固定大小输出。整图的cnn提取的是相对整图的特征，全局特征，后续对候选框区域再提取特征提取的就是候选框区域的，粒度更细。SPP里面还会进行多尺度的特征提取
SPP-Net论文详解
Joker_DDDu: 感觉你说的不太对既然我们都通过cnn提取出来了整张图片的特征，为何又要通过ss的区域进行特征提取，spp层的作用不是用来产生固定大小的输出的嘛
SPP-Net论文详解
keep learning1: 好文，点赞收藏了
SPP-Net论文详解
keep learning1: 为什么最开始是输出21维特征，多尺度训练时又输出14维特征？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。