机器学习--正则化（regularization)防止分类器过拟合

最新推荐文章于 2024-07-31 22:20:25 发布

helen1313

最新推荐文章于 2024-07-31 22:20:25 发布

阅读量4.5k

点赞数 1

分类专栏：机器学习文章标签：算法机器学习 regularization 过拟合分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/helen1313/article/details/53036791

版权

本文介绍了过拟合的概念及其在模型训练中的问题，提出了正则化作为避免过拟合的有效方法。正则化通过调整模型参数，降低特征权重，提升模型的泛化能力。分别详细讲解了线性回归和逻辑回归的正则化过程，包括代价函数的修改和梯度下降法的更新规则。

摘要由CSDN通过智能技术生成

本文参考吴恩达《机器学习》课程。

要介绍正则化，先要介绍一下过拟合的概念。

1 过拟合（overfitting）

拿线性回归中（房价-房子面积）为例，如下图，最左边那幅图中，我们用线性回归（一次函数，因为只有一个特征size）来进行拟合，可以看到拟合出来的线大致反应出房价的趋势，但是并没有很好的拟合，这种情况我们称之为欠拟合（underfitting）；为了更好的拟合，中间图我们用二次函数（即令x1=2, x2=x^2）来进行拟合，可以看到曲线很好的跟踪了样本点（样本点基本就在曲线的附近）；当我们用更高的阶来拟合样本点时，如最右边图所示，可以看到样本点很好的落在曲线上，但是显然的，这条曲线不是一条好的预测曲线，当再来一个新的样本点，我们进行预测时，这条曲线的预测能力会很差，因为它过分的去拟合了训练样本，从而不再适应于新的样本，我们称这种情况叫过拟合（overfitting）。同时，我们也会说这条曲线的泛化能力很差（一个从训练集得到的模型是否能够很好的泛化到新的样本上，称为这个模型的泛化能力）。通俗的理解过拟合：过分的拟合了训练样本，也就是说，模型不仅学习了样本的一般特性，还把样本的个体特殊特性也学习了，从而，当模型应用到新来的数据时，效果不是很好。

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。